NOBのArduino日記!

NOBのArduino日記!

趣味は車・バイク・自転車・ラジコン・電子工作です。

スキャナで読込んだ英文PDFを日本語Wordに変換!

イメージ 8
 
 電子部品を買うと英文の取扱説明書(紙)が付いて来たり、NETで古い電子部品の使い方を調べていると英文のPDF(スキャナで読込んだ画像)で出て来ます
 スキャナで読込んだ英文PDF(画像)をそのまま日本語に訳せたら良いなと思って調べてみたら、割と簡単に出来ましたのでまとめてみました

1. 取込み(“英文取説” を“英文画像”で取り込む)

 試しに紙の英文取説をスキャナで読み込んでPDFにした物が図1です。
 この英文PDFファイル(英文画像)を最終的に日本語Wordファイルに翻訳します。
※PDFにすればデジカメで撮った手書きの文字でも新聞紙でも翻訳可能です
イメージ 1
図1:紙取説「ゲルマニュームラジオ」をスキャナでPDFとして取り込んだ物

2. OCR変換(“英文画像” を“英文Word”に変換)

 OCR(日:光学的文字認識、英:Optical Character Recognition/Reader)とは、手書きや印刷された文字を、イメージスキャナやデジタルカメラによって読みとり、コンピュータが利用できるデジタルの文字コードに変換する技術です。
 GoogleからWEBブラウザ上で使える無料のOCR機能が提供されていましたので使ってみました
 
2.1 Google Driveログイン
 最初に図1のGoogleDriveにアクセスしてログインします。
イメージ 2
図2:GoogleDrive
 
2.2 英文PDFを読み込む
 GoogleDriveにログインした画面が図3です。
 この画面の空白上で右クリックし、開いたメニューの中から「ファイルをアップロード」をクリックします。
 次に、ファイルを選択する画面が出るのでPC中から訳したい英文PDFを選択して「開く」をクリックし、GoogleDrive上に転送します。
イメージ 3
図3:GoogleDriveにPDFをアップロード
 
2.3 PDFを文字データに変換
 アップロードした英文PDFのアイコン上で右クリックし、出て来たメニューの中から「アプリで開く」→「Googleドキュメント」の順に選択します。
 しばらく待つと図4の通りWEBブラウザ上に文字データに変換されたページが表示されます。
 GoogleDrive(マイドライブ)のページに戻ると、先程開いたファイルと同じ名前の青アイコンが出て来ます。
 このファイルが、英文画像をOCR処理して出来た文字データです。
イメージ 4
図4:GoogleドキュメントでPDFを文字データに変換
 
2.4 文字データをWord文書にしてダウンロード
 図4で作った文字データアイコン上で右クリックし、「ダウンロード」を選択するとWordファイルとしてPCにダウンロードされます
イメージ 5
図5:文字データをWordファイルとしてダウンロード

3. 翻訳(“英文Word” を“日本語Word”に翻訳)

3.1 Google翻訳を開く
 GoogleDriveのホーム画面右上に「Googleアプリ」と言うボタンが有りますのでこれをクリックします。
 クリックすると各種アプリのアイコンメニューが表示され、この中から「翻訳」と書かれたアイコンをクリックします。
 翻訳アイコンをクリックすると「Google翻訳」ページが開きます。
イメージ 6
図6:Google翻訳を開く
 
 「Google翻訳」画面の中段に「ドキュメントを翻訳」と言うリンクが張られているのでこれをクリックします。
 ファイルを選択する画面が開くので、図5でダウンロードしたWordファイルを選択して開きます。
 翻訳したいWordファイルがアップロードされると、画面上にアップロードしたファイル名が表示されます。
 この状態で、青い「翻訳」ボタンをクリックし、しばらく待つとWEBブラウザ上に日本語に翻訳された文書が表示されます。
 
イメージ 7
図7:Google翻訳
※今回は英語を和訳しましたが、それ以外に102ヵ国語翻訳出来ちゃう高性能翻訳機です
 
3.3 Wordに貼る
 図7で和訳した文書を選択・コピーして、Wordを開き貼り付け保存すれば図8の通り完成です!
イメージ 9
図8:英文画像(PDF)を日本語文書(Word)に変換完了!

4. まとめ

 Google翻訳の和訳精度は他の翻訳サイトに比べてかなり良さそうです!
 上手く翻訳出来ない所は、原文と突合せてなんとかするしかなさそうです
 何と言っても機械翻訳の利点は、尻込みしそうな物量(数百ページ?)の英文の紙資料であったとしても、短時間で翻訳してくれる所ですね!
 
イメージ 1 イメージ 3
励みになりますのでよければクリック下さい(^o^)/

↩【NOBのArduino日記!】目次に戻る