2005年06月27日(月) 21時18分
自然な会話音声を自動テキスト化、NECの音声認識ソフト(ITmediaエンタープライズ)
NECは6月27日、コンタクトセンターにおけるオペレータや管理者の業務に応用できる音声認識ソフトウェア「VisualVoice」をリリースすると発表した。同ソフトウェアはNECの中央研究所が開発した認識エンジンを中核とし、独自のアルゴリズムと自律型話者適応方式などによって、従来の「単語」や「定型文」レベルを認識する技術では難しいとされてきた人間同士の自然な会話の音声を高精度にテキスト化することができる。
「VisualVoice」では、顧客対応中のオペレータの発話音声をリアルタイムで認識し、オペレータが手作業で行っていた応対メモの記録やFAQ検索のキーワード入力を自動化できる。また、顧客対応中のオペレータの発話音声を認識することで、あらかじめ登録した任意の言葉をリアルタイムで検出し、管理者に自動で通知することも可能。
音声の認識率は「70〜80%」(NEC 市場開発推進本部 本部長 塩川正二氏)。この製品に組み込まれている「話しことば認識技術」を構成するいくつかの要素技術として、音響モデルの複雑さを数値化し、リソースに合わせて最適な音響モデルを作成する“木構造音響モデル”がある。言いよどみや発音のなまけなど話し言葉特有の特徴を事前に学習することで、話し言葉の特徴である音の多様性を高精度に表現できるほか、高い認識性能も実現する。また、発声のサンプル数に従って適応方法を制御し、少ないサンプル数でも安定して高い適応性を実現する自律型話者適応方式なども採用している。
現在ではオペレータの音声認識のみ製品化をしているが、2006年には顧客音声の認識も製品化する予定。
http://www.itmedia.co.jp/enterprise/ (ITmediaエンタープライズ) - 6月27日21時18分更新
http://headlines.yahoo.co.jp/hl?a=20050627-00000043-zdn_ep-sci