PDFや画像中の文字はOCRを使えば、効率的にテキストに文字起こしが可能です。OCRソフトは製品版からフリーソフトまで沢山ありますが、おすすめはGoogleドライブのOCR機能です。今日はGoogleのOCRでPDFや画像から文字起こしする方法を紹介します。
PDFや紙媒体の資料、画像の中の文字を日本語テキストデータに文字起こしする際はOCRが欠かせません。このOCRを使うと大量のPDFや紙媒体の資料もわざわざ手入力する時間と労力をかけることなく、テキストに文字起こしが可能になります。
そのため製品版やフリーのOCRソフトが沢山市場に出回っています。ですがわざわざOCRソフトを入手しなくてもGoogleドライブにはOCRが標準の機能として備わっていることをご存知でしょうか?
OCRとは、Optical Character Recognition/Readerの略で日本語では光学式文字認識という機能です。画像ファイルやPDFファイルを読み込み、そのデータの中から文字の輪郭を抽出、その輪郭がどの文字にあてはまるか判断しテキストとして変換する機能です。画像からテキストに文字起こしが可能なので、書類や黒板の写メをとり、OCRでパソコンにテキストデータとして保存するという使い方も可能です。
ですが、漢字の「二」とカタカナの「ニ」や、漢字の「一」と音引きの「ー」を混同したり、読み取れず記号やスペースが散見されるなど、OCR(光学式文字認識)ソフトの性能や読み込むファイルの状態によって文字認識の精度に違いがあります。
GoogleドライブのOCR(光学式文字認識)機能は、数あるOCRソフトと比べて文字認識の精度が高いと最近注目を集めています。
文字認識の精度の高さ以外にも、改めてソフトを購入したりインストールしたりする必要もなく、GoogleアカウントとGoogleドライブ、Googleドキュメントがあればテキストの文字起こしが可能です。さらに使い方も簡単で難しい手順を踏む必要もありません。
GoogleドライブでのOCR(光学式文字認識)機能による日本語テキストの文字起こしの使い方を具体的に説明していきます。
まずはGogleドライブ< drive.google.com>を開きます。Googleドライブを使用するにはGoogleアカウントが必要ですので、まだGoogleのアカウントを持っていない場合は、下記のリンクを参考にしてアカウントを作成して下さい。
今回はGoogleドライブの説明は省略します。使い方などの詳細は下記のリンクを参照して下さい。
GoogleドライブにOCR(光学式文字認識)機能で日本語テキストを文字起こししたいファイルをアップロードします。Googleドライブへのアップロードの方法は2通りあります。
①ファイルの入っているフォルダからGoogleドライブへドロップさせる方法(上の画像)と、②Googleドライブ上で右クリックし、「ファイルをアップロード」からテキスト抽出したいファイルを指定する方法(下の画像)の2つです。
右クリックしてアップロードする方法は、まずGoogleドライブの緑の枠内で右クリックし、「ファイルをアップロード」をクリックします。(緑の枠は右クリックするエリアの説明のために追加しています。実際にはGoogleドライブに緑の枠の表示はありません。)
フォルダが開きますので、日本語テキストに文字起こしさせたいファイルをダブルクリック、またはファイルを選択してから「開く/open」をクリックします。
どちらのやり方でもファイルのGoogleドライブへのアップロードが開始されると小さいウィンドウが開き、「アップロードしています」と表示されます。
アップロードにかかる時間はファイルの重さやパソコンの状態、ネットの通信速度にも影響されますが、アップロードが完了すると、ウィンドウが「アップロード完了」に変わります。このウインドウは「✖」で閉じて構いません。
Googleドライブへのファイルのアップロードが完了しました。
1 / 4
続きを読む