2015年01月13日のツイート

バッドノウハウ考案中

威沙について、手が届かない痒いところを解決すべく考えた方法。

問題点1

ページ左肩は、複数指定しても一つしか有効にならない。

問題点2

index要素は、一つのページで複数書いた場合、最後に書いた物だけが有効で目次にのる。

解決案

一度pdfを作っておいて、それを解析して独自に目次を作成する。

実際にトライ1

Perlでpdfからテキストが抽出できないかやってみた。
結論:駄目。
PDF::API2とかもテキストを抽出したら文字化けする。

実際にトライ2

何かのツールを使っては?

Adobe Acrobat
テキストに変換できるが、ページ情報が消える。ページ情報の消えない形式でテキスト、と言うのがない。

いくつか探した挙句にこれになった。

Renee PDF Aide
http://www.vector.co.jp/soft/dl/winnt/writing/se508643.html
ちょっと癖のあるテキストになるが、ページ情報があって現行のPDFも読み込めた。

ここまでくれば、独自に目次を作成することも不可能ではあるまい。以下、明日以降。

バッドノウハウ考案中

威沙について、手が届かない痒いところを解決すべく考えた方法。

問題点1

ページ左肩は、複数指定しても一つしか有効にならない。

問題点2

index要素は、一つのページで複数書いた場合、最後に書いた物だけが有効で目次にのる。

解決案

一度pdfを作っておいて、それを解析して独自に目次を作成する。

実際にトライ1

Perlでpdfからテキストが抽出できないかやってみた。
結論:駄目。
PDF::API2とかもテキストを抽出したら文字化けする。

実際にトライ2

何かのツールを使っては?

Adobe Acrobat
テキストに変換できるが、ページ情報が消える。ページ情報の消えない形式でテキスト、と言うのがない。

いくつか探した挙句にこれになった。

Renee PDF Aide
http://www.vector.co.jp/soft/dl/winnt/writing/se508643.html
ちょっと癖のあるテキストになるが、ページ情報があって現行のPDFも読み込めた。

ここまでくれば、独自に目次を作成することも不可能ではあるまい。以下、明日以降。

2015年01月13日のツイート

バッドノウハウ考案中

威沙について、手が届かない痒いところを解決すべく考えた方法。

問題点1

ページ左肩は、複数指定しても一つしか有効にならない。

問題点2

index要素は、一つのページで複数書いた場合、最後に書いた物だけが有効で目次にのる。

解決案

一度pdfを作っておいて、それを解析して独自に目次を作成する。

実際にトライ1

Perlでpdfからテキストが抽出できないかやってみた。
結論:駄目。
PDF::API2とかもテキストを抽出したら文字化けする。

実際にトライ2

何かのツールを使っては?

Adobe Acrobat
テキストに変換できるが、ページ情報が消える。ページ情報の消えない形式でテキスト、と言うのがない。

いくつか探した挙句にこれになった。

Renee PDF Aide
http://www.vector.co.jp/soft/dl/winnt/writing/se508643.html
ちょっと癖のあるテキストになるが、ページ情報があって現行のPDFも読み込めた。

ここまでくれば、独自に目次を作成することも不可能ではあるまい。以下、明日以降。

2015年01月13日のツイート