スマホ・タブレット デジタル関連

iPhoneの音声入力の認識精度

iPhone音声入力の認識精度

 

AbemaテレビのAIポンとかを見ているとまだまだだなと思っていた音声入力ですが、iPhoneの音声入力は結構使える感じになっていました。最近の性能向上ぶりに気がついていませんでしたが認識精度はかなり高いという印象です。ちなみにこの文章も途中までは音声入力で行いました。

いくつかトライしてみましたがiPhoneだとGoogleドキュメントを使いつつ音声入力を使用するのが簡単に文章を作成できる感じです。

実際の音声入力中の画面

昔の音声入力の印象

昔IBMでCMしている頃は音声入力と言うものはほとんど使えなかった印象なのですがいつの間にかびっくりする位性能アップしていたんですね。

ちなみにIBMのCMがどのくらい昔なのかと思ったら22年も前の1998年でした。「先日いただいたべったら漬け、あなたの温もりがこもっていた、あなたの愛がこもっていた、まる」という香取慎吾さんのCMがかなり懐かしいですね。

キーボード入力と比較しても結構圧倒的な速度

もはや音声入力は月日の経過と共にキーボード入力と同じくらい使える入力システムに成長している気がします。人前だとさすがに恥ずかしいですがリモートで自宅で仕事をする人も増えてきている昨今、音声入力を活用すると仕事がもしかしたら少しだけ効率的に出来るかもしれませんね。

不慣れな人がタイピングするキーボードでの文字入力よりも圧倒的に速いですね。

雑音にも実は強い

個人的には音声入力は静かな場所でないと駄目という勝手な思い込みがありましたが、子供がテレビの音声を大きくして見ているリビングで試してみたところ、テレビ音声とかラジオの音とかはちゃんと録音した音声と認識しているみたいです。人間の生の声とは違うと判断しているみたいでテレビの声を変換したりは全然しないですね。

そんなわけで会議とかの文字起こしとかをやる場合は録音した会議の音を流しながら、声で読み直していくみたいな作業で割と出来てしまうんじゃないかなと思います。騒がしい音が録音の音声によるもので人間の肉声で騒がしいのでなければ結構正確に文字変換してくれるみたいです。

アンドロイドは使ったことがないのですがアンドロイドの方も音声入力は結構優れているのでしょうか?機会があったら試してみたい気がします。

なんにしても、一回音声でざっと入力して後から手で直す作業にすれば結構長文を簡単に作成できる気がします。

ドライブ中とかSiriでメッセージも楽

ドライブ中はスマホに触れないので結構便利です。ヘイSiri!とSiriを起動させて「〇〇にメッセージ」と呼びかければ、メッセージを起動させてくれて音声入力した文書を一切スマホに触らずに送信してくれます。

これはまさに未来だと感じます。ただ通常の音声入力中に呼びかけても「尻」と変換されますが(笑)

音声入力でよく使う句読点たち

私がよく使っている音声入力の句読点は下記の通りです。

、 ➡「てん」  

。 ➡「まる」

改行➡「かいぎょう」

 

因みに「かいぎょう かいぎょう」と2回唱えるとちゃんと2段改行してくれます。

 

この他にも

「かぎかっこ」

「かっことじる」

「すらっしゅ」

「たぶきー」

とかがあるみたいです。私はあまり使ったことはありませんけど。

間違いなく声を出しても恥ずかしくないシチュエーション(1人の車の中とか)だったらキーボードよりも音声入力の方が断然効率良いかなと思います。滑舌はちょっとはっきり気味に話す必要はありますが。

もうちょっとな点

定番の「庭には二羽ニワトリがいる」と喋ってみたところ「にはにはにはニワトリがいる」となってそこはやっぱりもう一歩な気もしますけど(笑)

少々の変換ミスは割り切って最後に訂正しようという広い心で使えば結構素晴らしいものなのかもしれません。音声入力には可能性を凄く感じる昨今です。

-スマホ・タブレット, デジタル関連