kuniku’s diary

はてなダイアリーから移行(旧 d.hatena.ne.jp/kuniku/)、表示がおかしな箇所はコメントをお願いします。記載されている内容は日付およびバージョンに注意してください。直近1年以上前は古い情報の可能性が高くなります。

PDFファイル内の文字列のコピー貼り付けで文字化け

日本語(2バイト)文字をコピーしてテキストエディタやMS-ExcelMS-Wordなどに
貼り付けたが

□□□□□□□□□□□□□
のようになってしまう。

ExcelやWordで、形式を選択して貼り付けで、”テキスト”を選択しても同じ現象。

どうやら、問題の発生するPDFは、Acrobat等で PDFファイルを開いて、ファイル→プロパティで文章のプロパティの概要の詳細情報を見ると

PDF変換: Mac OS X 10.9.X Quartz PDF Context
PDFのバージョン: 1.3(Acrobat4.x)

となっている。

対処方法は、google driveにPDFをアップロードして、
ブラウザの中でGoogle Drive内でPDFをひらくと、Googleが表示してくれる。
その表示された中身をコピー&ペーストしたら、文字化けしなかった。

なお、Macで元のPDFファイルをひらいて、コピー&ペーストした場合は文字化けなし
始めからMacで開けば良かった