音声認識で文章を書いたら効率がグッと上がった

日紀

最近音声認識を使い始めた。なぜ音声認識を使い始めたかと言うと、キーボードに向かってタイピングするのに比べて、音声認識の方が文字の生産効率が高いと言う話を聞いたからだ。実際にやってみると、確かにそれは実感できた。昔の音声認識と言うとそもそもそれほど精度がなくて、そもそも音声認識で打った文章に対して推敲の時間がかなり必要だったと言うイメージだ。今もそれは過去の話になっていると思う。もちろん推敲が全く必要ない文章を話すのは難しい。それはキーボードを使って書いたとしてもある程度は同じである。

最近使っているのは、iPhoneのデフォルトで搭載されているキーボードの音声認識と、Google Docsの音声認識の2つだ。どちらの音声認識も同じくらいの精度で自分の声を聞き取ってくれる。聞き取ってもらいにくいのは、例えば同音異義語であったり、自分がそもそもあまり口を開けずに喋っているときの声だったり、知らず知らずのうちに日本語をきちんと発音していないような言葉だったり、そういうものである。いつも旅行にいったときとかは文書を書いて残したいと思う反面、文書を書くのは時間がかかってしまうため、とりあえず放置してしまうことがよくある。音声認識であれば、目をつぶって寝ながら携帯またはパソコンに向かって喋るだけで文章ができるので、気軽に文章の土台ができる。カナダの旅行日記も音声で書いて、キーボードで推敲している。

iPhoneの方が頭がいいのは、「、」「。」を口で言っても認識してくれることである。改行も認識してくれる。Google Docsの方が良いところは特にないけど、特に手元に携帯がなかったとしても、クロームのブラウザさえ使えていれば使えるところが良いところだと思う。なんとなくGoogle Docsのほうが精度がよいときが多い気もする。使い方はそれぞれ下記の通りでかんたん。

iPhoneの場合

あいうの下のマイクみたいなのを押す

これが出てると喋れる

Google Docsの場合

ツール -> 音声入力を押す。またはCtrl+Shift+S

左に出て来るマイクのアイコンを押すと赤くなり、音声認識し始める。

ここから先は蛇足。自分のことを考えると、口に出してものを伝えるよりも、文章で書いてものを伝える方が、得意な気がする。読む時もそうだ。ひたすら長い話を聞くよりも、文章を読んだ方が自分のペースで理解が出来るし、必要に応じて前の情報を確認しながら読むことができる。

一方でアメリカでは、音声で何かを伝えるということがすごい日本に比べて多い。人々が文章を読んだり書いたりそういうことがあまり好きじゃないからか、それともそういうことが苦手なのか理由はあまりよくわからないけれども、とにかく二言目には、「この番号に電話してください」と書いてあることが多い。そしてその電話するだけというのが一種の魅力として書かれているケースが多い。「電話するだけでオーケー!(なんて簡単!)」みたいな感じである。自分としてはそもそも話す英語に自信がないし、それ以上にアメリカの電話の先の人がイマイチな人だった場合、間違えるので、重要な情報を音声で伝えることに不安がある。容易に間違えるんではないかと思う。実際に容易に間違っているのをよく見る。

だんだんその音声優位なアメリカの社会に慣れてくれるといいなと思うけれどもそれほどまだ慣れてきていない。そういえば英語でも音声認識して日記がかけるんだろうか。

コメント