音声入力の調整

音声入力の調整方法

現在のシステムは日本語の音声認識モデルしか含まれていないため、デフォルトコンテンツは日本語でしか動作しません。英語のモデルを含む更新は近日中に行われる予定です。

起動後、MMDAgent-EX はマイクデバイスの入力を ON にして音入力の検出および認識を行います。ここでは音声入力の調整方法について説明します。

音声入力状態

MMDAgent-EX は音の入力を常にモニターし、人の声を検出したとき音声認識を行います。音の入力状態は画面左下の円形の音入力インジケーターに表示されます。円の大きさが音の大きさ、円の色が検出の状態です。

赤い透明円が出ているときが、声だと判定されて音声認識が行われている状態です。青の円や、中央のオレンジの円だけのときは、有効な音声入力でないとみなされ、認識が行われていない状態です。

左から順に (1) 認識OFF:声は検出されていません。(2) 認識OFF:声らしきものを検出していますが音声認識は有効ではありません。(3) 認識ON:音声認識が行われています。

無言状態で円が既に大きく、オレンジや赤の円が出っぱなしのとき
周囲の雑音が大きすぎて音声認識がうまく動かない状態です。静かな場所へ移動するか、デバイスの録音ボリュームを下げるか、後述の方法で入力音のスケーリングを小さく調整してください。
話しても円が大きくならず、赤の円が出ない場合
録音音量が小さすぎて声を検出できていません。デバイスの録音ボリュームを大きくするか、後述の方法で入力音のスケーリングを大きく調整してください。

一時停止・再開

音声入力を一時停止するには、タブバーのマイクのアイコンをタップして Listening audio を選択してください。再び同じ操作を行うことで再開できます。

タブバーのマイクアイコンをタップして `Listening audio` で音声入力の一時停止・再開。

スケーリング調整

録音音量が大きすぎたり小さすぎたりするときは、まずデフォルト録音デバイスが正しく選択されていること、およびその録音ボリュームの設定をチェックしてください。MMDAgent-EX はシステムの設定をアプリ内から変更しません。利用者の責任で、適切な音量になるよう調整してください。

手動での調整が難しい場合(iOS/Android等)、さらに入力音のスケーリングをアプリ内で設定できます。タブバー左端のアイコンをタップし、メニューから [speech]-Adjust input scale... で以下のような調整バーが表示されます。中央の四角いハンドルを上下に動かしてスケーリング値を調整できます。

画面左端に入力音スケーリングの調整バーを表示させる

デフォルトの位置(目盛りがある位置)がスケーリングを行わない(係数 1.0)デフォルト状態です。デバイスから入力された音声はすべてこの係数をかけてから音声認識エンジンに入力されます。上に動かすと音量を増幅し、下に動かすと減衰します。一番下は係数が 0.0 となり、音声入力は完全にミュートされます。

その他の設定

音声認識には Julius が用いられています。フルの Julius が組み込まれており、コンテンツ内に .jconf ファイル を書くことで、パフォーマンス調整や音声検出の条件、辞書の変更、モデルの追加・調整等、Julius で設定できることはなんでもMMDAgent-EX 上で行えます。方法は .jconf ファイル の書き方を参照してください。


最終更新 2021.01.12: ja, Manual finished (04a2abc)