朝顔日記

簡易音声ブラウザ?

2004-04-13

IBM の ProTALKER 97 エンジン もしくは、マイクロソフトの Text to SpeechSAPI 4.0 runtime support があれば、あれこれ読み上げることが出来るので、もしかして、音声ブラウザも出来るのではないかと思ってあれこれ探していたら、とりあえず、ブラウザで表示中のページを割に簡単に読み上げる方法がありました。

Speech Pad 2 というフリーのアプリを使います。これは何をするものかというと、任意のテキストを読み上げるものです。クリップボードを監視して、クリップボードの中身を自動的に読み上げるということもできます。まず、マイクロソフトの Text to Speech の日本語版(Lernout & HauspieR TTS3000 TTS engine - Japanese)を導入します。違う国のものを導入すると、日本語がしゃべれません。次に、SAPI 4.0 runtime support も導入します。これで、音声エンジンへの受け渡しのインターフェースが導入されたことになります。Speech Pad 2 を導入して、画面に何か入力してみます。書いた文字列が読み上げられるはずです。さて、これで準備完了。Speech Pad 2 のクリップボード監視にチェックを入れておいて、ブラウザで任意のページを開きます。ページを全部選択してコピーします。Ctrl+A して、Ctrl+C すればいいでしょう。すると、あら不思議、ちゃんと音声で読み上げてくれるではないですか。って、当たり前なんですが。:p)

Speech Pad 2 のスクリーンキャプチャ

もちろん、この方法では、リンクを辿ったりすることはできないし、そもそも、リンクとそうでないテキストの判別すらつかないわけですが。それでも、音声読み上げがどんな感じで行われるのかを体験してみる程度には、使えると思います。

きっとブラウザのレンダリング済み画面をコピーするのではなくて、ソースをコピーして、リンクとそれ以外の部分くらいの解析を行い、SAPI に渡す際に、ピッチとか、読み上げ音声の種類を変更するようにすれば、もっと本物の音声読み上げブラウザぽく出来るのかもしれません。あるいは、さらに media="aural" な css までをも読んで、細かく制御できれば、音声スタイルに対応したものに出来るのかも、と夢想してみたり。Mozilla Firefox の拡張とかで、そういうのできんものかなぁ。

「簡易音声ブラウザ?」へコメントをつける

書き込み時の挙動について
URI らしき文字列には自動的にリンクが張られます。また "<" や、">" は実体参照化されます。
スパム対策のため、リファラを切っていると投稿できません。

トラックバック

1: 腹這いの日々/音声で読むブログ (2005-01-24T01:45:30+09:00)
自分のブログをPCに読み上げてもらおうと
この記事の永続的 URI ならびに トラックバック ping URI
http://diary.noasobi.net/2004/04/diary_040413a.html