コンテンツにスキップ

拡張子の正体

解説

テキストとバイナリで、ファイルの種類は名前のうしろに付く .xlsx.csv といった「拡張子」で見分ける、と書きました。ところが多くのパソコンでは、この拡張子がふだん画面に出ていません。だから見分けるどころか、その存在に気づいていない人も少なくありません。データをきちんと扱うなら、まず拡張子を表示させて、意識するところから始めます。

拡張子とは、ファイルの種類を示す名札

Section titled “拡張子とは、ファイルの種類を示す名札”

拡張子とは、ファイル名のうしろに付く .◯◯ の部分です。請求書.xlsx なら .xlsx売上.csv なら .csv。ピリオドのあとの数文字が、そのファイルが何の種類かを表す名札になっています。

パソコンは、この名札を見て「これは Excel で開くファイルだ」「これはメモ帳で開くテキストだ」と判断し、対応するソフトでファイルを開きます。つまり拡張子は、中身そのものではなく、あくまで「種類を示すラベル」です。

ところが、拡張子はふだん隠れている

Section titled “ところが、拡張子はふだん隠れている”

やっかいなことに、Windows も Mac も、初期設定では拡張子を画面に表示しないことがほとんどです。請求書.xlsx は「請求書」、売上.csv は「売上」とだけ見えます。名前をすっきり見せる親切のつもりなのですが、おかげで肝心の種類が見えなくなっています。

困るのは、種類の違うファイルが見分けられなくなることです。たとえば同じ「請求書」という名前でも、請求書.xlsx(Excel)と 請求書.pdf(PDF)はまったく別の種類のファイルです。拡張子が隠れていると、この違いが名前からは分かりません。

ですから、データを扱うなら、設定を変えて拡張子を表示させておくことをおすすめします。Windows ならエクスプローラーの表示設定、Mac なら Finder の設定で切り替えられます。一度オンにしておけば、それ以降はどのファイルも種類が名前で見えるようになります。

拡張子が読めると、テキストかバイナリかが見分けられる

Section titled “拡張子が読めると、テキストかバイナリかが見分けられる”

拡張子が見えるようになると、前回の話がそのまま役に立ちます。ファイルにはテキストとバイナリの2種類があり、どちらかは多くの場合、拡張子で見分けられます。

  • テキスト系(人がそのまま読める).txt.csv.md(Markdown)、.html(Webページのもと)など
  • バイナリ系(専用ソフトが要る).xlsx(Excel)、.docx(Word)、.pdf.png.jpg(画像)など

「中身がそのまま読めるか、専用ソフトでないと読めないか」を、いちいち開いて確かめなくても、名前のうしろを見れば見当がつく——拡張子が読めるというのは、そういうことです。

名前を書き換えても、種類は変わらない

Section titled “名前を書き換えても、種類は変わらない”

ここで一つ、よくある誤解にも触れておきます。拡張子はあくまで名札なので、売上.xlsx売上.csv と手で書き換えても、中身まで CSV に変わるわけではありません。名札を貼り替えただけで、中身は Excel の形式のままです。むしろソフトが正しく開けなくなることがあります。種類を変えたいときは、ソフトの「形式を指定して保存」などで変換するのが正しいやり方です。

だから、AIとのやり取りでも役に立つ

Section titled “だから、AIとのやり取りでも役に立つ”

拡張子で「これはテキストか、バイナリか」が見分けられると、AIに何をどう渡すか・どう受け取るかの判断がしやすくなります。テキストならAIが直接読めて直接出せる、バイナリなら裏でプログラムを一段はさむ——前回見たこの違い(→ テキストとバイナリ)を、拡張子という手がかりで素早く見当づけられます。拡張子が読めることは、その判断の入り口になります。

拡張子は、ファイルの種類を示す名札。Windows も Mac も初期設定では隠しているので、データを扱うなら、まず表示させて意識するところから始めます。拡張子が読めれば、テキストかバイナリかも見分けられ、AIに何をどう渡すかの判断にもつながります。名前のうしろの数文字は、ふだん見過ごしがちですが、ファイルの素性を教えてくれる手がかりです。