« JCount1.05リリース | メイン | JCount1.06リリース »

PDFで「encrypted.」という文字だけが抽出された場合

JCount1.05からxdoc2txtを使用してPDFがカウントできるようになりましたが、
暗号化されているPDFについては「encrypted.」とだけ出力されます。

これについては同梱しているxdoc2txt.txtのAdobe PDFの項目に説明がありますので
そこから引用します。

・暗号化されたPDFに対応していません。ただし、別途暗号化モジュール cryptlib.dll  を http://www31.ocn.ne.jp/~h_ishida/KWIC.html からダウンロードして解凍し、  xdoc2txtのインストールディレクトリに入れると、パスワード無で暗号化されたPDFに  ついては検索・表示できるようになります。PDF1.4の128bit暗号にも対応しています。  ただしcryptlib.dllの使用は個人・教育用途に限定されます。

とのことですので作者の意図した範囲内で御利用下さい。

トラックバック

このエントリーのトラックバックURL:
http://bgworks.info/mt/mt-tb.cgi/33

コメント (2)

SONODA:

最近、JCOUT 1.06をインストールさせていただきました。.doc文書などは、ドラッグするだけで、一瞬のうちに文字/単語カウントしてくれ、大変便利に使用させていただいているのですが、PDFファイルをドラッグした場合、カウントは開始するのですが、文字列と認識しないようで、カウント結果はいつもゼロになります。複数の異なるpdfファイルで試行しても同様の結果です。「xdoc2txtを使用してPDFがカウントできるようになりました」ということですが、pdfファイルをカウントする場合、ただドラッグするだけではなく、何らかのアクションが必要でしょうか?

大変お手数をおかけいたしますが、ご教授いただければうれしいです。どうぞ、よろしくお願いいたします。

bgworker:

そのPDFファイルをAdobe Readerで開いて「ファイル→テキストとして保存」とするとどうなりますか?

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)

About

2007年07月07日 10:46に投稿されたエントリーのページです。

ひとつ前の投稿は「JCount1.05リリース」です。

次の投稿は「JCount1.06リリース」です。

他にも多くのエントリーがあります。メインページアーカイブページも見てください。