紙の本を音声で聞くためのベストプラクティス

日紀

ここ数か月、紙の本を何とかしてオーディオブックとして聞くための方法を模索してきていた。いままでに下記2つの記事も書いた。

最近、ベストプラクティスをよりよくすることができたので、また忘れないうちに書いておこうと思う。

OCR(テキスト化)

前回の記事では、Scansnap付属のABBYYを使うのがもっともベターだと書いた。Nuance PDFはなぜかOCR中にPDFが回転してしまうという致命的な欠陥があったし、Google Driveは面倒な手順が必要で時間がかかるからである。ただし、精度的にはGoogle Driveがもっともよかった。

Google Driveを使ってなんとかOCRができないものかと思い、プログラムを書いた。PDFを80ページずつに分け、それをひとつずつGoogle Driveにアップロードし、OCRを行い、その結果をダウンロードし、その結果をテキストに結合して、最後に整形する。いままでこの作業に15分くらい要していたが、このプログラムを使うことで作業時間は3秒くらいになった。

一気にすばらしい品質のテキストが得られるようになって大満足。

読み上げソフトウェア

前回の記事ではApple Books一択と書いたが、いまはGoogle Play Books一択である。Apple Booksは読み上げがそこそこ自然で操作もしやすかったのだが、致命的な欠点として、時々なぜだか読み上げがストップしてしまうことがある。これがなかなかイライラさせられる欠点で、再現性がなく止まるし(もう一度同じところを再生すると問題なく使える)、頻繁に止まるときがあった。何とかならないかと思い、ほかの手段を探した。

Google Play Booksは、読み上げが非常に自然であり、かつCloud上に本をアップロードできるので優れもの。ただし、Apple Booksと違い、読み上げるためにはEpub形式でアップロードする必要がある。上記のGoogle Driveを使ったプログラムのアウトプットはテキストファイルなので、それをEpubに変換する必要がある。

これにはCalibreというソフトを使っている。ほかにもいろいろ方法がありそうだが、あまり深く調べていないのでとりあえず問題のないCalibreを使い続けている。

このGoogle Driveを使ったOCRプログラムと、Google Play Booksの組み合わせによりいままでに比べて格段に快適に音声読み上げ可能な電子書籍を自分で作成することが可能になった。日々いつでも本が読めてすばらしい。

下記はGoogle Play Booksのスクリーンショット。

 

参考ウェブサイト

コメント