Googleドライブで画像の手書き文字をテキスト化してみる
こんにちは!
2020年も11月に入りましたね。
あと数日でアメリカ大統領選挙で、こんな時だけ木村太郎さんのコメントが気になるのは私だけではないと思います。。。
さて、タイトルの件、Googleドライブの使える機能を紹介します。
正確に言うとGoogleドライブとGoogleドキュメントを合わせた機能、と言うべきかもしれません。
もっと正確に言うと、
『Googleドライブの中の画像をGoogleドキュメントで開くとOCRしてくれる』
というものです。
OCRとは、紙に書かれている文字を認識し、デジタル化する技術のことでOptical Character Readerの略です。Opticalか~、、、OCRは結構前からあって、スキャナーの機能だったりします。
OCRを正確に言うと、
『紙文書をスキャナーで読み込み、書かれている文字を認識してデジタル化する技術』
RICOHさんのホームページより抜粋
資料は紙で、という時代のものですね。
確かに、昔は相手の紙資料をテキスト化したいこともよくあったので重宝しました。
逆に思い出すのは、、、取締役会用の資料を印刷するのに終電に間に合わず、朝まで掛かって用意するなんてことも少なからずありました。
ということで、、今回紹介するものはOCRと呼んではいけないですね。
今回紹介するのは、
『Googleドライブ上の画像ファイルをGoogleドキュメントで開くと、画像中の文字を認識してテキスト化しくれる』
ということにしておきましょう。。。
私がこのGoogleの機能を知ったきっかけは、チラシ制作用のお客様持参の参考資料が画像(JPEG)でして、その画像のテキストをそのまま流用したいとのこと、ただし手動で文字お越しする量ではなかったので、何か良いものはないかと探したことでした。
PDF や写真のファイルをテキストに変換する
Google ドライブでは、画像ファイルをテキストに変換することができます。引用元:Googleドライブヘルプ
形式は JPEG、PNG、GIF、PDFに対応、ファイルサイズは2Mまでといくつか制限があるものの、実際にやってみると、あっさりOCR、じゃなくて文字認識してくれました。
ごく普通のフォントを使用した文字画像だったからか、あまりに完璧に認識してくれちゃったので、逆に消化不良というか、もうちょっと試そうと思い、下のような手書き文字を用意しました。
結果は以下の通り。
しこまめ
そんバナナ
薔薇
薔薇
おおー
”ひよ”が読めず、“し”
”そんな”の”な”が読めませんでしたが、
”薔薇”が、フォントと手書きの両方とも読めましたね。
文字選びのセンスは、気にしないでください。
ということで、Googleドライブを利用しているかたは、是非お試しください~。
店主/斉藤