音声認識といえば、パッと思いつくのはiOSの「Siri」やAndroidの「OK Google」だと思います。
今ではスマホに標準搭載されている音声認識機能ですが、最近ではWeb APIを通して音声認識を実現できる世の中になりました。
GoogleやMicrosoft、IBMなどがAPIを公開しています。
これらAPIは、基本的にはスマホアプリか、自前でサーバを用意してサーバから利用する仕様になっていることが多いです。

では、ブラウザからJavaScriptで音声認識するAPIがないかといえば、実は存在します。
「Speech Recognition API」というJavaScript APIで、現時点ではPC版/Android版のChromeでのみ使用できます。
下記デモページで実際の動作を確認できます。

デモページ
※PC版Chromeでは別途マイクが必要になります。
※SP版Chromeでは先に1度動画を再生する必要があるようです。

音声認識開始ボタンをクリックして「ON」にすると音声読み取り待機状態になります。
待機状態で、マイクに向かって「再生」「停止」「前」「次」と言うと、対応した音声によって、動画が再生、一時停止、10秒戻る、10秒進むといった動作をします。
また、認識した音声の結果が「音声認識結果」にテキストで表示されます。
一定時間か、認識処理が1回終わると待機状態が解除されるため、再度音声認識するには、また「ON」にする必要があります。
(ドキュメントにはずっと待機状態にできるようなことが記載さてますが、少なくとも私の環境では必ず解除されてしまいました。。。)

実際使ってみると、ちゃんと漢字にも変換され、かなり認識精度が高い感じがします。
おかげで自分の滑舌の悪さがよくわかりました。。。

まだ対応ブラウザがChromeのみなので、実制作で使うのはかなり難しいですが、一昔前までで大変だった技術が、今では手が届くところまできているのを感じますね。

YSD