2011年12月17日

PDF-Viewer OCR機能

PDF-XChange ViewerはフリーのPDFビューワーである。

Ver2.5(Build200)で、フリーでOCR機能が使えるようになった。

Ocr001 ドキュメント/OCR Pages...以下

試にマニュアルから画像だけのテキストの無いPDFを作成し、
そのPDFにOCR機能を利用してテキスト抽出し、できたPDF
のテキストを選択コピーし、テキストエディタに貼り付け、調べた。

一部の文字が誤変換等(*注)が確認されたが
おおむね変換ができていた。フリー版で使えるのはGood!!

(*注)試行結果(誤変換例)
(オリジナル)This was the very first build incorporating **NEW** features
(OCR)This was the very
?rst build incorporating **NEW** features

(オリジナル)o  PDF-XChange PRO Version 4
(OCR)0 PDF
)(Change PRO Version 4

日本語のOCRはサポートがまだ無いと思っていたら、日本語の言語パックを
追加することで選択肢に追加された
。まだ実験はしていないが興味のある方は
試行してはいかがでしょうか?(図は日本語の選択肢を選んだところ)

Ocr_j1 

なお「OK」でテキスト抽出したら、そのPDFを別名で保存するだけです。

----皆様の「拍手ボタン」クリックが、Blogオーナーの励みとなります!
拍手する --クリックだけでは個人情報は送信されません。

posted by dodemoii at 14:36| Comment(7) | TrackBack(0) | PDF-XChange | 更新情報をチェックする
この記事へのコメント
こんにちは
ヤフー質問広場から来ました。
先程は私の質問への回答ありがとうございました♪

何回も追記できるとばかり思っていたので焦ってしまい、ここにたどり着くことができました。

フローティングツールバーのことですが、言われたとおりに環境設定→インターネットの閲覧モードを解除をしてみました。

そうしたら、フローティングツールバーが消え、上の方にメニューが出てきました(以前は消えるフローティングしか出ませんでした)

なんか、1歩前進した気がします!!!!ありがとうございます!!

でも上の方にメニューバーでは保存マークをクリックしても反応がありませんでした。
消えるフローティングツールバーも同じような感じで反応がなかったので、少し心配。

上に出てきたメニューバーで反応があったのは唯一、拡大%だけでした^^;

なんででしょうかね~~;

ほとほと困ってしまいます。

一度アンインストールした方がいいでしょうか??

わかる範囲でまた何かありましたら是非!!!助けて下さい。

長文すみませんでした。
Posted by dandelion at 2011年12月29日 10:27
初めまして。pdf xchange viewerが気に入りPRO版のライセンス入手した者です。OCR機能で基本的な使い方を教えてください。日本語のデータインストールしLanguageにjapaneseも表示されています。スキャナーした文字画像をOCRでテキスト変換したいのですが、OKボタンで何やらミドリのバーグラフ表示の後、そこでストップします。ファイルは出来ているのでしょうか。どこに作成されるのですか?PC内探しても見つかりません。宜しくお願いします。
Posted by toshi at 2012年01月14日 21:14
toshiさんへ
訪問&書き込みありがとうございます。
OCRのダイアログで設定後「OK」とすると緑のバーが進み
完了すると思うのですが、その状態でOCRが済んでいますので
そのPDFを名前を付けて保存するだけです。
日本語の試行は時間が取れればテストしてみたいと思います。
P.S.
Pro版を購入されたのですか。それはすごいですね。
Posted by dodemoii at 2012年01月14日 23:38
ご回答ありがとうございます。たぶん私の場合エラーになって途中でストップしているのだと思います。ファイルは出来ず「元の画面に戻ってしまいます。エラーと表示してくれれば良いのですが、何事もなかったかのように元の画面に戻ります。理由がわかりません。もっと調べてもます。ところでPREO版は3000円でおつりがきますよ。クレジットカード不要で購入出来ます。http://www.altech-ads.com/Others/payment.htm#atm
Posted by toshi at 2012年01月15日 10:54
適当なサンプルの画像(1枚)をPDFに変換して、OCR機能を日本語でテストして見ましたが、
緑のバーが67%で止まった状態で、放置していたら、いきなり100%となり終わりました。
フォントをコピーして適当なエディタに貼り付けると化け化けで日本語になりませんでした。
プロパティからフォントを確認するとArialMTでした。
時間を見てまたテストしたいと思いますが、試行ではダメでした。
Posted by dodemoii at 2012年01月15日 17:00
1月23日付でバージョンアップされています。多少の変換違いはありますが、日本語も埋め込まれるようになりましたよ。
Posted by take at 2012年01月24日 17:01
takeさんOCRの情報ありがとうございます。
確かに新しいバージョンだと日本語のフォントが抽出されますね。
それでも先のテストサンプルでは、化け化けでしたが、
もう少し文字サイズが揃っているものでテストしたら、かなりマシに
なりましたので、ものによっては使えるかもしれません。[E:happy01]
Posted by dodemoii at 2012年01月24日 23:26

この記事へのトラックバック