« Windows VistaのOEM(DSP)版の価格はXPとほぼ同等か? | メイン | Windows Vista+Bluetoothヘッドセットで音声認識 »

Windows Vistaの音声認識機能。これは意外に便利かも

《2006年10月30日》 《カテゴリー:Windows Vista

Windows Vistaには音声認識機能が標準で装備されます。
上位版との差別化でさみしい状態になっている
Home Basicにもなぜか音声認識がのるようです。

でも、なぜか雑誌でもウェブサイトでも紹介しているところを見かけない。
音声認識なんてみんな興味ないのでしょうか。
ちなみにGoogleで「Vista 音声認識」をキーワードにすると、
このサイトが一番上位にヒットしました。
http://www.technobahn.com/cgi-bin/news/read2?f=200608022009
あやしいサイトではないのでぜひご覧ください。

音声による操作で効率アップ

で、実際に試してみましたが、
製品版でチューンナップされるのであればぜひ使ってみたい、
というのが正直な感想です。

音声認識で何ができるのか。
ソフトの起動やボタンのクリックなどの操作はすべて音声でできます。
また、読み上げた文を漢字仮名交じり文で入力できます。

たとえば、
・「わーどぱっどをきどう」と言えばWordが起動する
・「めもちょうをきどう」と言えばメモ帳が起動する
・「わーどにきりかえ」と言えばウィンドウがWordに切り替わる
・「とじる」と言えば現在のウィンドウが閉じる
・保存するか確認するダイアログが出たら「おーけー」

「いんたーねっとえくすぷろーらをきどう」と言ってみると、
スタートメニューには2つの「Internet Explorer」があり、
どちらを選択するか問い合わせるダイアログが開きます。
下の写真の場合、「に、おーけー」といえば、
普通のInternet Explorerを起動できます。

プログラムの選択

もちろんWindows標準のアプリだけでなく、
自分でインストールしたアプリでもOK。
「ふぁいあーふぉっくすをきどう」でFirefoxが起動します。
ということは名前が重複している場合、
「ブラウザ」みたいな名前のコピーを作れば、
「ぶらうざをきどう」で行けそうです。
これなら確認ダイアログを経由する必要もありません。

このあたりのオペレーションはけっこう認識率も高く、
スムーズにできるようです。
自分は20型ディスプレイを2台並べたマルチディスプレイ環境で、
マウスポインタを見失うことがしばしばあります。
また、ウィンドウが同時に20個以上開いていることも。
デスクトップが広大になった現在、
マウス中心のオペレーションはそろそろ限界にきている気も。
音声認識でウィンドウ切り替えやソフト起動ができれば、
作業効率がぐんとアップするはずです。

面白いのは「ばんごうをひょうじ」というコマンド。
クリックできる箇所に番号が割り当てられ、
たとえば下の写真で「前のページに戻る」ボタンをクリックしたいときは、
「ご、おーけー」と言えばそのボタンをクリックできます。
ウィンドウに重なる番号表示は半透明なので、
下のボタンや文字もうっすら見えています。
半透明インタフェースが有効に使われていると感じたのは、
これが初めての経験です。

番号を表示2

「ばんごうをひょうじ」の他にも、
メニューやボタンの名前を読み上げると、
そこをクリックしたのと同じことになります。
たとえば、「へんしゅー、こぴー」のように。

ただし、CPUにかなり負荷がかかるのか、
それともまだ最適化がされていないのか、
動きはすぐくもっさりしています。
「××をきどう」と言っても反応がなく、
もう一度繰り返して言うと二重に起動したりします。

現状ではもっさり動作にストレスいっぱい

音声認識を有効にした状態ではかなりCPU使用率が上がります。
テストしたのは、
・CeleronD 2.53GHz 1GBメモリ
・Core2 Duo T7200 1GBメモリ
の2台です。
CeleronDではつねに50%を超えるような状態で、
システム全体のスピードに影響を与えます。
Core2 Duoでも50%越えはありませんが、
それなりにCPUの使用率が上がっています。

2000年ごろにIBMのViaVoice98を試したことがあります。
http://www.center-left.com/lab/04_viavoice.html
このころでも音声認識はけっこう快適に動かせていました。
当時から比べるとCPUの処理能力は格段に向上しているので、
現在でもこんなに音声認識で負担がかかるのか、
ちょっと疑問に思えるところもあります。

Vista自体の最適化が進んでいないのが理由かもしれません。
プロセスのリストを表示させると、
すごくいっぱいのプロセスがバックで動いています。
製品版ではチューニングされるものと期待したいところです。

音声認識機能を有効にする方法

さて、すでにVistaを試している人向けに音声認識の設定方法です。
コントロールパネルの「コンピュータの簡単操作」を開き、
「音声認識オプション」をクリックします。
「音声認識の開始」を実行すれば、
設定ウィザードが起動して、マイクのレベル調整などが行われます。
その後、チュートリアルが自動的に起動して、
使い方を一通り説明してくれます。

音声認識オプション

しかし、そのままではあまり認識率が高くないので、
「音声認識トレーニング」を実行しなければなりません。
ViaVoiceではエンロールと呼ばれていたもので、
画面に表示される文を読み上げていくと、
ユーザーの声が登録され、認識率が向上します。
10分くらいかかります。

音声認識トレーニング

 

投稿者 yasu : 2006年10月30日 12:23

トラックバック

このエントリーのトラックバックURL:
http://www.center-left.com/cgi-bin/Mt-3/mt-tb.cgi/1406


コメント




保存しますか?

(書式を変更するような一部のHTMLタグを使うことができます)