拡張子の正体
解説
テキストとバイナリで、ファイルの種類は名前のうしろに付く .xlsx や .csv といった「拡張子」で見分ける、と書きました。ところが多くのパソコンでは、この拡張子がふだん画面に出ていません。だから見分けるどころか、その存在に気づいていない人も少なくありません。データをきちんと扱うなら、まず拡張子を表示させて、意識するところから始めます。
拡張子とは、ファイルの種類を示す名札
Section titled “拡張子とは、ファイルの種類を示す名札”拡張子とは、ファイル名のうしろに付く .◯◯ の部分です。請求書.xlsx なら .xlsx、売上.csv なら .csv。ピリオドのあとの数文字が、そのファイルが何の種類かを表す名札になっています。
パソコンは、この名札を見て「これは Excel で開くファイルだ」「これはメモ帳で開くテキストだ」と判断し、対応するソフトでファイルを開きます。つまり拡張子は、中身そのものではなく、あくまで「種類を示すラベル」です。
ところが、拡張子はふだん隠れている
Section titled “ところが、拡張子はふだん隠れている”やっかいなことに、Windows も Mac も、初期設定では拡張子を画面に表示しないことがほとんどです。請求書.xlsx は「請求書」、売上.csv は「売上」とだけ見えます。名前をすっきり見せる親切のつもりなのですが、おかげで肝心の種類が見えなくなっています。
困るのは、種類の違うファイルが見分けられなくなることです。たとえば同じ「請求書」という名前でも、請求書.xlsx(Excel)と 請求書.pdf(PDF)はまったく別の種類のファイルです。拡張子が隠れていると、この違いが名前からは分かりません。
ですから、データを扱うなら、設定を変えて拡張子を表示させておくことをおすすめします。Windows ならエクスプローラーの表示設定、Mac なら Finder の設定で切り替えられます。一度オンにしておけば、それ以降はどのファイルも種類が名前で見えるようになります。
拡張子が読めると、テキストかバイナリかが見分けられる
Section titled “拡張子が読めると、テキストかバイナリかが見分けられる”拡張子が見えるようになると、前回の話がそのまま役に立ちます。ファイルにはテキストとバイナリの2種類があり、どちらかは多くの場合、拡張子で見分けられます。
- テキスト系(人がそのまま読める) …
.txt、.csv、.md(Markdown)、.html(Webページのもと)など - バイナリ系(専用ソフトが要る) …
.xlsx(Excel)、.docx(Word)、.pdf、.pngや.jpg(画像)など
「中身がそのまま読めるか、専用ソフトでないと読めないか」を、いちいち開いて確かめなくても、名前のうしろを見れば見当がつく——拡張子が読めるというのは、そういうことです。
名前を書き換えても、種類は変わらない
Section titled “名前を書き換えても、種類は変わらない”ここで一つ、よくある誤解にも触れておきます。拡張子はあくまで名札なので、売上.xlsx を 売上.csv と手で書き換えても、中身まで CSV に変わるわけではありません。名札を貼り替えただけで、中身は Excel の形式のままです。むしろソフトが正しく開けなくなることがあります。種類を変えたいときは、ソフトの「形式を指定して保存」などで変換するのが正しいやり方です。
だから、AIとのやり取りでも役に立つ
Section titled “だから、AIとのやり取りでも役に立つ”拡張子で「これはテキストか、バイナリか」が見分けられると、AIに何をどう渡すか・どう受け取るかの判断がしやすくなります。テキストならAIが直接読めて直接出せる、バイナリなら裏でプログラムを一段はさむ——前回見たこの違い(→ テキストとバイナリ)を、拡張子という手がかりで素早く見当づけられます。拡張子が読めることは、その判断の入り口になります。
拡張子は、ファイルの種類を示す名札。Windows も Mac も初期設定では隠しているので、データを扱うなら、まず表示させて意識するところから始めます。拡張子が読めれば、テキストかバイナリかも見分けられ、AIに何をどう渡すかの判断にもつながります。名前のうしろの数文字は、ふだん見過ごしがちですが、ファイルの素性を教えてくれる手がかりです。