2010年4月5日月曜日

PDFその4

 さて、印刷された資料ってありがたいものなのだが、大きさが固定されていること、物理的な場所をとること、検索が大変であること・・など何かと厄介なものでもある。
 勢い、スキャンしてPDFで取っておくか・・と言う整理法が喧伝されている。

 まぁ、概ね良しとしよう・・

 近年、コピー機が進歩著しい。また、複合機も性能が高くなっている。

 で、そのスキャン機能をうまく使うと書類整理に面白いアイデアを組み込める。

 必要な機材としては両面スキャンのできるコピー機なり複合機。もちろんPCもね・・

 冊子状のものは可能であれば解体すると便利・・

 これをまずスキャンしてPDF化する。これはどこでも紹介されている。

 これを、透明テキストを張りつけられるソフト(Acrobatなど)で、OCRを掛けて透明テキスト化するのだな・・どういうことかというと・・普通、スキャンした書類はGifかJpgファイル、つまり画像ファイルとして扱われる。
 これをこのままPDF化してもあくまで画像ファイルだと言うことが問題。

 確かに印刷してそのまま元の書類のように見えることが見えるが、内容の検索が一切できないのよね・・
 そこで、普通はOCRと言う頭がでてくると思う。
 が、OCRはOCRで出力はWordかExcelへと言うものが多くPDFではない・・これは元の画像ファイルの純画像部分の扱いが厄介・・

 で、PDFにクリアテキストという考え方が出てくるわけだ。

 これは見た目は画像ファイルとしてのPDFのその上に、OCRのテキスト文章を透明化してかぶせたもの・・つまり、元の文章の見た目のまま、テキスト検索が可能になる・・

 そんなもの何の役に立つのか?と思われる方もおられるかとは思うが、PCが一般化する前の資料や新聞の切り抜き記事などの整理、再利用の時に力を発揮するはず。文書間の横断検索ができなければ何のためのPCか?ですよね?

 よって、今つらつら考えるソフト的機能としては、データベースでこのクリアテキスト付きのPDFの格納と検索機能。
 データベースのインタフェースデザインにPDFが張りつけられること、PDFからのCSS生成、クリアテキストとその可視化テキストを2ペイン表示して修正可能になる編集ソフト。

 スプレッドシートのバックグラウンドにPDFを張りつけられれば、印刷書式に合わせてエクセルのセルデザインも調整しやすいねぇ・・

PDFその3、認識視野のことなど

 Macユーザーで古い人ならMacPlusやSEの時代を覚えていらっしゃると思う。
 生活費を削りながら捻出した費用でようやく購入したPlusはまだFDD2driveの時代。ハイパーカードが発表されHDDが必須と言われ、泣く泣く「お安くなりました!大容量20MB!138,000円!」^^;;という時代の話。
 ハイパーカードは、ビル・アトキンソンが認知科学の成果を取り入れ、一目で頭に取り入れられる人間の目の視野角を十二分に考慮して8インチというMacPlusやSEの画面で実現した表示領域をカード化して開発されたものだ。

 現在、ディスプレイは広大化の一途を辿っている。
 もちろん、タブロイド紙を全面表示できる・・などと言うメリットは当然ある・・あるが・・こと印刷物を頭にたたき込んで推考しなければならないなどと言うとき、A4の用紙サイズって眼球移動の量が多く・・というか視野角が広過ぎて用紙を追うことに疲れないだろうか・・

 昨今、用紙サイズの統一が叫ばれB版の書類はめったに見なくなったのだが・・確かに書類の整理には良い・・が頭に入れるツールとしてはチョット厄介・・

 で、先ほどのハイパーカードのことを思いだした・・

 では我々が通常使うツールとしてもっとも馴染みよく膨大な情報を楽しみながら入れられるものって何かというと・・そう・・意外や書籍なんだ・・
 出版不況がどうのと喧伝されていても、長い人類の歴史に寄り添ってきた情報ツールとしての完成度は侮るべからず。
 そう、新刊本のあの大きさ以下・・(まぁ文庫本も含め・・)が重要だと気がついた。片手で開いてすいすい読み進められて頭に残りやすい大きさのリミットなんだね・・

 といことで、終わってはPC VS Bookの不毛な争いになるので、ここはその成果をどう日常に仕事に生かすかを再考。

 ここで、PDFというよりAcrobat Readerのちょっとした機能に注目!

 印刷ダイアログのページの拡大縮小ドロップダウンリストの一番下・・なんと小冊子印刷と言うアイテムがある。
 これは両面印刷機能のあるプリンタを使用した場合、A4両面に各2ページずつ印刷し、全部印刷が終わったところで、2つ折りにするか、真ん中で切断し、中とじ製本をすることで、普通に読める冊子形式になると言う機能だ。

 もちろんプリンタドライバでこの機能を実現しているメーカーもある(ブラザーの両面機種ほか)が、使い慣れているAcorbatReaderにこの機能があるなら使わない手は無い・・

 筆者はこれで出力したものを、製本テープで製本してポータビリティと、頭への入力に使っている。
 かなり楽になるんですよこれ・・A4全サイズの印刷なんて見たくも無くなりました・・あ!これは欠点かな?

pdfのこと2

 各社ポータルサイトサービスの中でも、自由設計度の高いものにgoogleのiGoogleがある。
 まぁGoogleAppsと言う手もあるが、個々はより簡便に気楽に使うということから、iGooglel経由でgoogleDocsとの連携をPdf活用という視点で探ってみる。

 Webクリップで記事を保存整理したいという用途は、仕事絡みの調査ではよくある。まぁ発想の下材料にもなるし・・

 日経BPの記事や@ITなどのよく作り込まれたサイトでは、印刷用表示が利用できる。
 これは余計な広告やらリンクを排除し、印刷に適した表示をWeb上でも行ってくれるのだが、これをPDFにすると、実に後ほど扱いやすいものとなる。(加筆修正をしないものとしてだけどね・・)
 が、同じ日経でも複数ページ表示のままというサイトも多々ある。

 まぁ、PDF結合ソフトを使用して一旦複数のページにしてから結合という手もあるにはある・・でもあまりスマートではないし、一旦はPC上が散らかることに違いはない。

 よって、GoogleDocs(Googleドキュメントとも)の出番。

 このサービスもともとはWritelyだったと思うが、ネット上でWordやExcel相当の機能をサービスしていた会社を買収してブラッシュアップしたものだ。
 ついこの間までWord、Excel、powerPointの書類はアップ、編集できたが、PDFはアップだけ・・その他ファイルはアップ不能だったが、現在はアップロードは各種ファイルに対応している・・もちろんダウンロードも可。

 で、ここをどう使うか?が味噌。

 現在参照している記事サイトを開いたまま、新規ウィンドウを出す。ここでGoogleDocsの画面にして新規ドキュメントを文書で生成する。
 こんこウィンドウを当初の記事サイトのウィンドウとカスケード表示し、文書編集エリアをドラッグアンドドロップしやすい位置関係に置いておく。
 で、記事の必要部分を選択し、ドラッグアンドドロップで文書エリアへ・・
 で、次の記事を表示し、同じ要領でドラッグアンドドロップ・・これを、必要ページ分繰り返すと見事に一本の記事となって文書化される。

 このGoogleDocs上の文書。印刷してみるとわかるが、macOSXではPDF生成され、Windows上ではAcrobat Readerで印刷される。つまり、PDF扱いの保存となっているのだな・・
 もちろん、必要とあればPC上にWordでもPDFでもODF(OpenOffice.orgでのOpen書類)でもダウンロードできるのね・・

 このやり方のメリット。

 自分のPCあるいは会社のPCを汚さない、自己、自社資源を消費しない
 ネット環境があればどこでも利用可能
 Net上の情報を一元フォーマットで管理可能
 他人(他のメンバー)との共有が可能

 もちろん、機密事項や個人情報の取扱には充分注意して欲しい・・

pdfのこと1

 pdfは、Appleがポストスクリプトプリンターを採用したことにより派生的に生成された技術である。まぁ、ポストスクリプトプリンターに送りだす言語をそのまま書類表示にも使うと機種依存、プログラム依存の無い書類ができるのではないかという発想だったのだろう・・(憶測含む)

 まぁ、Adobe社のAcrobatがもっともスタンダードなpdfツールであるが、MacのOSXは標準でプレビューというpdfビューワーを搭載しているし、純正のプリンタードライバーからPDF生成も可能である。(まぁいろんなロックをかけたりとかは出来ないけどね・・)
 もちろんサードパーティからも各種のビューワー、エディターはデリバリーされている。

 で、パスワードを掛けたりプリントロックをかけたりなんてのは、セキュリティや権利意識にうるさい人が勝手にやって欲しい・・ここではこれを如何に自分の情報生活・・つまり自己経営的に役立てるかを検討したい。

最初に

 ネットの普及により、各種の情報整理ツールは充実、幾多の整理法なども紹介されているが、4年で倍になるという情報量と僕らは戦わなくてはならない・・
 楽しくないと記憶力も落ちると言われるし、如何に楽しくこの情報津波の時代を乗りきるか・・自分なりに活用している整理法をそれこそ整理してみたい。
 脳科学や認識力の調査なども活用して行くつもり・・