Logo image
UEC Website Open Policy Finder
サインイン
Referential reconstruction in complex frequency domain for word recognition under noisy environments
ジャーナル論文 - rm_published_papers: Scientific Journal   査読済み

Referential reconstruction in complex frequency domain for word recognition under noisy environments

The Journal of the Acoustical Society of Japan, Vol.64(9), ページ533-544
09/2008

抄録

本論文では音声に雑音が重畳した単一チャネルの信号から原音声を復元し,自動音声認識性能を向上させる手法について述べる。著者らはすでに,小規模の音声データベースを事前に用意し,ある尺度で入力フレームと類似しているフレームをデータベース内から抽出し,その抽出したフレームを参考にして出力を得るという手法を提案しているが,本論文では更にその類似尺度と出力方法の改良法を報告する。改良の要点は,短時間フーリエ変換後の位相情報をそのまま保持しておくことと,そこにバイナリマスクをかけることの2点である。性能評価をするために器楽曲雑音及び環境雑音を用いて単語認識実験を行ったところ,低いSNRにおいて単語正解率の改善が見られた。

ファイルとリンク (3)

url
http://ci.nii.ac.jp/naid/110006873894表示
is_downloadable: False
url
http://ci.nii.ac.jp/ncid/AN00186234表示
is_downloadable: False
url
http://id.ndl.go.jp/bib/9649121表示
is_downloadable: False

メトリック

1 レコードビュー

詳細

Logo image