Search This Blog





エクスパンシス

Wednesday, July 18, 2012

ScanSnap S1500とEvernoteで名刺管理 #2 / Business Card Management #2

Adobe AcrobatによるOCR処理

スキャンした名刺のPDFファイルにAdobe AcrobatでOCRをかけて、テキストを認識させ、検索が容易にします。というか、これをしなければ名刺をスキャンスナップで読み込む意味がありません。なお、Adobe AcrobatはOCR作業を行う際に同時に圧縮をかけてファイルサイズを小さくする事が出来ます。これによって劇的にファイルサイズが小さくなるようですが、たまにファイル画像が歪んだりと悪さをする場合もあるので、私の場合はこの機能は外しています。
OCR処理と言っても数回クリックするだけです。Adobe Acrobatのツール>テキスト認識>複数のファイル内からOCR処理をかけたいファイルを選択して、下のウィンドウを開いたらファイルをドラッグ&ドロップ。


OKをクリック後、出力オプションを設定。OCR処理後のファイルを別名で保存することも可能ですが、ここでは不要でしょう。


で、PDFの出力形式を『検索可能な画像』とした場合は、ダウンサンプルのレートを選択します。前述のとおり、この選択に如何でファイルのサイズが劇的に変わりますが、表裏両面の名刺を今回紹介した設定でスキャンすると300KB/1ファイル。片面だと約半分ですから、Evernoteの無料アカウントでも最低200枚前後/月は放り込めます。なので、基本的にファイルサイズは考えなくて良いかと思います。OCR処理完了後はEvernoteにアップロードします。


Evernoteにアップロード

Evernoteのアカウントがある前提です。まず適当な名前で新規ノートブックを作ります。もちろん、WEBとシンクするノートブックです。次にOCR処理が完了した名刺のPDFファイルを、先ほど作ったノートブックにドラッグ&ドロップします。これでEvernoteに保存完了です。名刺の表示もEvernoteらしく画像サムネイル付きで見易く良い感じです。


次に検索機能です。私の場合Evernote無料アカウントなので、PDFファイルに対するEvernoteのOCR機能を使えないということと、後述するGoogle Driveでの検索もあって、Adobe AcrobatでOCR処理をかけています。試しに田中さんで検索してみましたが、きちんと2枚ヒット。英数字での検索ももちろん可能です。また、外出先ではiPhoneもしくはiPadでEvernoteにアクセスすれば見られますし、もちろんWEB上のEvernoteにアクセスしても良いでしょう。


余談ですが、万が一のバックアップとしてGoogle Driveにも保存してあります。この利点はバックアップになることと、Gmailの検索ボックスから探したい名刺を検索できることです。

ということで、2回に分けましたが、大体このような感じで名刺管理を行なってます。とりあえず100枚前後の名刺で作業を行ないましたが、大凡1時間で終了しました。いろいろ試しながらやっていたので、慣れれば半分くらいの時間で出来ると思います。

  



関連記事
導入編: 富士通スキャンスナップS1500とプラス PK-513L #1
裁断編1: 富士通スキャンスナップS1500とプラス PK-513L #2
スキャン編: 富士通スキャンスナップS1500とプラス PK-513L #3
OCR編1: 富士通スキャンスナップS1500とプラス PK-513L #4
裁断編2: 富士通スキャンスナップS1500とプラス PK-513L #5
OCR編2: 富士通スキャンスナップS1500とプラス PK-513L #6
閲覧編: 富士通スキャンスナップS1500とプラス PK-513L #7
消耗品編: 富士通スキャンスナップS1500とプラス PK-513L #8

ScanSnap S1500とEvernoteで名刺管理 #1
ScanSnap S1500とEvernoteで名刺管理 #2

Tuesday, July 17, 2012

ScanSnap S1500とEvernoteで名刺管理 #1 / Business Card Management #1

ScanSnap S1500Evernoteで名刺管理


少し放っておくとすぐに大量に溜まる名刺。一昔前なら名刺をクルクル回して見つけるローロデックスが有名だった。これはこれでアナログチックで良いのだけど、今の時代にはもっと良い物がある。


ということで、私が行なっているScanSnap S1500Evernoteを組み合わせて、いつでもどこでも必要な名刺を簡単に検索できる方法をブログします。なお、ScanSnap S1500には同梱の名刺専用アプリケーション『名刺ファイリングOCR』があるのですが、如何せんファイルをローカルに保存するので、今回は使っていません。また、Evernote以外のクラウドサービスでも良いのですが、後述のとおり、Evernote自体がiPhoneと非常に相性が良く、OSやモバイルなどの環境に依存すること無く非常に使用しやすいので、Evernoteにしました。


ScanSnap S1500を使った名刺管理の目的
ScanSnap S1500Evernoteで名刺を管理する目的は幾つかあります。
  • 物理的な名刺の破棄: 愛読書から子供の保育園の書類まで、とにかく机から紙という紙を無くす作業の一環。
  • データベース化: 社名や苗字などで用意に検索出来るようにデータベース化。
  • 極力簡単な作業: 従来の名刺管理ソフトのように、スキャンして個別情報は手入力というのは避けたいところ。枚数が少ないうちは良いのだけど、大規模カンファレンスの後などは、打ち込む作業だけで膨大な時間を費やしてしまう。
  • いつでもどこでも検索可能: ローカルPCにデータベースを置いては、外出先などからアクセスすることが出来ないため、クラウドを使って特定のOSや機種に依存しないユニバーサルアクセスを構築。
クラウドサービスには幾つかあり、Google Docs (Drive)やDropboxなどでも試してみたのですが、iPhoneからのアクセスが最も容易で、月間アップロード容量が無料アカウントでも60MBと十分かつクラウド容量の上限を気にしなくても良いEvernoteScanSnap S1500の組み合わせで作業を行います。名刺データベース化の作業手順は以下のとおり。
  1. 名刺のスキャン: 機械的に両面スキャンするだけ。面倒なのでファイル名も修正しない。ファイル名で検索する時代は一昔前のこと。
  2. Adobe AcrobatにてOCR: 複数の場合はバッチ処理で。
  3. Evernoteに保存: ドラッグ&ドロップ。全てアップロードされたら元データは削除。
なお、何回かテストした結果、Adobe AcrobatのOCR精度がScanSnap S1500純正よりも高精度で有ることが分かったので、個人的にはAdobe AcrobatによるOCRを推奨しますが、いずれ僅かな差なので気にならないという場合は、ScanSnap Managerの設定で『検索可能なPDFにする』をチェックすれば上記の2.は不要となります。さらにこの場合『アプリ選択』でEvernoteを選択すれば、スキャン終了後ファイルをダイレクトにEvernoteに放り込めるので更に作業が楽になります。


準備: ScanSnapの設定
別に面倒な事はなく、これさえ終われば後はAcrobatとEvernoteで名刺管理可能です。まず、ScanSnapのScanSnap Managerの、設定ページ > 読み取り設定 > 新しい読み取り設定、 をクリックして適当な名前を付けて保存。次に、各項目を以下のように設定。
  • アプリ選択:  Adobe Acrobat読み込み完了に自動で起動しますが、もちろん手動で起動してもOK。
  • 保存先: 任意
    いずれローカルデータは削除するのでデスクトップで良いかと。
  • 読み取りモード: 以下のように設定。OCRの精度を確保したいので少し高精細側に振っておく。また、オプション内の項目は白紙ページ削除以外のチェックボックスは全てOFF推奨。


  • ファイル形式: PDF
    前述のとおりOCRはScanSnapに装備されたOCRエンジンも使用可能ですが、何回かテストした結果、Adobe AcrobatのOCR精度がScanSnap純正よりも高精度で有ることが分かっているので、ここではチェックを外しておきます。ただ、枚数が多い初期の読み込み作業時などは、大量のファイルをまとめてバッチ処理出来るので、アクロバットを推奨します。


  • ファイル形式のオプション(重要): 以下のように2ページで一つのPDFを作るようチェックを入れる。すると、裏表を読み込んだスキャンスナップが名刺1枚ごとに1つのPDFファイルを作成し保存してくれます。

  • 原稿: 原稿サイズは自動。超音波による重なり検出もON。
  • ファイルサイズ:
    幾つかのファイルで検証の結果、ファイル圧縮率は2が最適。
これで、ScanSnap Managerの準備は完了。後は名刺を読み込むだけ。名刺の表裏と読み込む向きに注意してスキャンをすれば、後は勝手に名刺の枚数分だけのPDFのファイルが作成保存されます。さて、次はAdobe Acrobatでの作業。

  



関連記事
導入編: 富士通スキャンスナップS1500とプラス PK-513L #1
裁断編1: 富士通スキャンスナップS1500とプラス PK-513L #2
スキャン編: 富士通スキャンスナップS1500とプラス PK-513L #3
OCR編1: 富士通スキャンスナップS1500とプラス PK-513L #4
裁断編2: 富士通スキャンスナップS1500とプラス PK-513L #5
OCR編2: 富士通スキャンスナップS1500とプラス PK-513L #6
閲覧編: 富士通スキャンスナップS1500とプラス PK-513L #7
消耗品編: 富士通スキャンスナップS1500とプラス PK-513L #8

ScanSnap S1500とEvernoteで名刺管理 #1
ScanSnap S1500とEvernoteで名刺管理 #2