コンテンツにスキップ

OCR

画像の中にある文字を読み取って、コンピュータで扱える文字データに変換する技術。スキャンした書類や、写真に写った文字をテキストにするときに使う。読み取りの精度は元の画質しだいで、不鮮明だったり手書きだったりすると誤りが混じることがある。

くわしくPDFには2種類ある

関連用語テキスト拡張子

光学文字認識