Life

【圧倒的精度に感動】Googleドライブを使って本の画像から文字起こししてみた

こんな悩みに答えます

書籍の1文を引用するとき、手打ちするのが面倒くさい…

読書ノートを作っていて、毎回書籍を見ながら打ち込むのに時間がかかっているのがつらい…

私も紙の本を月10冊程度読んでいるのですが、そのときにいつも困るのが読書ノートの作成なんですよね。

読書後に印象に残った内容や線を引いた部分をエバーノートにまとめているのですが、紙の本の場合は、手打ちするしかありませんでした。

しかし、なんとか効率化できないか?と考えたときに画像から文字起こしできることを思い出しました。

精度が低いと聞いていたのでダメ元でいくつか試して見たんですが、Googleの機能が圧倒的な精度で画像を文字起こしできるに気づきました。

本記事では、Googleが提供している文字起こし機能の精度と、その手順について解説します。

これまで書籍などの文を見ながらタイピングしていた人も、この機能を使うとスマホで写真を撮るだけで文字起こしができるようになりますよ。

Googleの画像文字起こし精度

まずはどのように画像から文字起こしができるのか、実際の画像と結果を見ながら紹介します。

手元にたまたまあったこちらの2冊をサンプルに使用しています。

書籍(縦書き)

 

なかなかよい人脈を築くのは難しいと思います。 「レバレッジ人脈術」という言葉に、他人をもっと利用してメリットを得るようなイメージ を持ち誤解されている方もいるかもしれません。
しかし、「レバレッジ人脈術」はまさにその考えの対極にあるような考え方なのです。人, に頼ったりお願いしたりするのではなく、あくまでもコントリビューションで関係を 深めながらお互い切磋琢磨し、関わった全員が相乗効果を得ていこうという精神です。 これが、今まで私の提唱してきたパーソナルキャピタルづくりの中でも、異彩を放つところ でしょう。
「お山の大将系」では、レバレッジが効かない
人脈には大きく二つのパターンがあります。 一つは、その地位や肩書などによって一人が頂点に立ち、その他大勢がつき従う「お 山の大将系」、もう一つは並列的につながり、ともに成長することを目指す「共生系」 です。それぞれの人の考え方によって、だいたいどちらかに大別できるものです。
ただ「お山の大将系」では、レバレッジが効きません。「自分が大将だから、黙ってつい
てきなさい」と言われれば、その周囲にいる人は楽かもしれませんが、成長もできないでし ょう。結局はお互いに何も価値を生み出さないし、マインドも伝染しないのです。
一方の共生系は、自分より、ある面で優れていると思える人とつながるということです。 一方的に誰かをリスペクトするのではなく、お互いにそういう部分を持ち合うのがポ イントです。これが、お山の大将系とは大きく違うところです。
こういう人たちとつきあっていれば、当然自分も勉強になるし、もっと上を目指そうとい う気にもなってくる。相手にもそういうマインドを与えることができます。
そのためには、自分もインプットを増やしたり、相手のことをよく考えたりする必要があ ります。しかし、それがけっして「苦」ではないことは、本書のノウハウを実践していただ ければわかることだと思います。
「BS(バランスシート)型」人脈づくりのすすめ
「世の中には、大きく分けて「PL(損益計算書)型」の人と「BS(バランスシート) 型」の人がいます。
Leverage 1

見開きで撮ってみましたが、精度は100%でした。

ページの角を折っていたり、赤色のペンで線を引いていても問題ありません。

画像の左下に少しだけ映っている『Leverage1』までしっかりと文字起こししてくれていますね。

書籍(横書き)

 

感謝をこめて
私が最初に「ザ・マインドマップ』(原書名:The Mind Map® Book)の 初版を書き上げたのは、15 年前のことだ。以来、世界 20 か国以上で定期的 に新しく版を重ね続けてきた。
このたび、新しい日本語版ができたことを、たいへんうれしく思っている。 私は日本の、文化、知的娯楽、武道、食べ物、そして人々を特別に愛してい るからだ。私は、合気道と碁で、名誉ある「段」を所持していることを誇り に思っている。
日本語版を出版するにあたり、舞台裏で疲れを知らずに働いた多くの人々 がいる。とくにあなたが今持っているこの本を訳してくれた、私の最 も頼れる仲間・神田昌典氏。本物の知的戦士であることをすぐに証明してく。 れたダイヤモンド社の私の担当編集者・渡辺考一氏。そして、あらゆる場面 に参加し、見事なサポートをしてくれた、ダイヤモンド社の海外版権担当者・ 浅川まどか氏――に感謝したい。
さらに、次の方々にあらためて感謝したい。このすばらしい旅に私たちを 送り出してくれた両親、ゴードン・ブザンとジーン・ブザンに。とくに、本 書を書き上げることができたのは、母が毎日、献身的に支えてくれたからで ある。編集者のヴァンダ・ノースは、著者に劣らない熱心さで本書の執筆に 協力してくれた。ロレイン・ギルは画家として、見ることの重要性と本質、 イメージ、脳や記憶や創造性がいかに芸術と関わっているかについて深い知 識を示してくれた。デボラ・ブザンは、長年にわたりこのプロジェクトに協

横書きでも全く問題ないですね。

こちらも精度100%でした。

書籍の表紙

ちょっと難しそうな表紙で試してみました。

マインドマップの明日
世界的ベストセラー
オフィシャル マインドマップ・ブック
考える技術
ダーのない原
バイブル
コミュニケーション能力
創造力
学習スキル 記噛力
ザ・マインドマップ
脳の力を強化する思考技術
[著] トニー・ブザン
バリー・ブザン 神田昌典 [訳]
世界的権感脳
ベストセラー作家
カリスマ コンサルタント
The Mind Map Book

一部画像が悪く見えづらくなっている部分と、文字が分かりにくい箇所にミスがありました。

それでも法則性がない表紙で9割程度の精度は出してくれていますね。

Googleの文字起こし精度は、十分実用性のあるものだと確信しました。

画像を文字起こしする手順

ここからは実際にどのようにして文字起こしするのかを解説していきます。

とっても簡単なので、一度試してみてその精度を確認してみて下さい。

①写真を取る

まずは文字起こししたい部分の写真を撮りましょう。

書籍の文字起こしをしたい場合、ページを開きながら写真を撮るのは結構難しいので、ブックスタンドがあると便利ですよ。

私はこれ↓を使ってます。

②Googleドライブへアップロード

撮った写真をGoogleドライブにアップロードしましょう。

Googleドライブで文字起こしできる形式が「JPEG」「PNG」「GIF」「PDF」のため注意して下さい。

私はiPhone8で写真を撮っているのですが、デフォルトでアップロードすると、HEIC形式になっていて変換できませんでした。

拡張子を変更するなどいろいろ方法はありますが、私はGoogleフォトに同期してパソコンからダウンロードしています。

iPhone⇛Googleフォト⇛PCにダウンロード⇛Googleドライブにアップロード

こうすることで自動でJPG形式に変換してくれるため、複数枚あっても手間がかかりません。

本当であれば、GoogleフォトからGoogleドライブに直接アップロードしたいですが、現在はその方法はないようです…

私はマイドライブの中にOCRという名前でフォルダを作成し、画像をアップロードしています。

(OCRとは光学的文字認識のことで、画像から文字に起こす技術のことです。)

③変換したい画像を文字起こし

最後は画像から文字起こしをします。

とっても手順は簡単です。

画像を右クリック⇛アプリで開く⇛Googleドキュメントをクリック

これで自動でGoogleドキュメントに文字起こしの結果がテキストで出力されます。

自動でGoogleドキュメントが開いて、以下のように画像と書き起こした文字が並んでいます。

1点だけ不満があるとすれば、この文字起こしは一括で処理することができないため、1つ1つGoogleドキュメントで開く必要があります。

多くの画像を処理したい場合は少し手間がかかるかもしれません。

まとめ:画像を文字起こしして効率化しよう!

本記事では、Googleが提供している文字起こし機能の精度と、その手順について解説しました。

要点をまとめます。

要点まとめ
  • Googleの画像文字起こしは圧倒的精度
  • Googleドライブにアップロードしたらグーグルドキュメントで開く

たったこれだけで精度の高い画像からの文字起こしができます。

私はここまで文字起こし精度が高くなっていることを知らなかったので、感動してしまいました。

この技術を活用することで、多くの作業を効率化できる可能性があります。

ぜひGoogleドライブからの文字起こしを活用してみて下さい。

 

特に読書ノートを作るときとっても捗るのでおすすめですよ。

【Evernote活用】 読書ノートを作る簡単な方法 ビジネス書を中心に月20冊程度読んでおり、読書ノートづくりに励んでいます。 本記事では私が実践するEvernote...

 

読んで下さりありがとうございました。