早稲田大学 知覚情報システム・メディアインテリジェンス研究室

音源分離

音源分離

音源分離は、複数の音源から発せられた音が混じりあった信号から元の音を復元する技術で、音声対話システムや遠隔会議システムなどを開発する上では重要な役割を果たします。小林研究室では、小型マイクロホンアレイでリアルタイム処理が可能な音源分離技術を開発しました。近年では、歪が少なく高精度に元の音を復元可能な音源分離技術の検討を進めています。

音声らしさを考慮したブラインド音源分離

歪が少なく高精度なブラインド音源分離の実現を目指して、音源である音声らしさを考慮しながら音源を再現する方法を提案しました。

分離処理による歪が少ない方法として、独立成分分析(ICA)や独立ベクトル分析(IVA)などの線形分離行列を用いた枠組みが提案されています。しかし、ICAやIVAは分離された信号が統計的に異なるように線形分離行列を推定する枠組みであり、音源らしさは考慮されていません。提案法は、事前に音声を学習させた連想記憶モデルを用いることで、再現される音が音声らしくなるように分離行列を推定します。こうして推定された分離行列を用いて元の音を再現することにより、歪が少なく高精度に音源を再現することが可能となります。

BSS

図1:スペクトログラムの例。 提案法により観測信号(a),(b)から分離音声 (c),(d)が得られる。(c),(d)はそれぞれ元音声(e),(f)に類似する。

Related Publications

  • Motoi Omachi, Tetsuji Ogawa, Tetsunori Kobayashi, “Associative memory model-based linear filtering and its application to tandem connectionist blind source separation,” IEEE Trans. ASLP., vol.25, no.3, pp. 637-650, Mar. 2017. doi: 10.1109/TASLP.2017.2653941 [IEEE Xplore]
  • Motoi Omachi, Tetsuji Ogawa, Tetsunori Kobayashi, Masaru Fujieda, Kazuhiro Katagiri, “Separation matrix optimization using associative memory model for blind source separation,” Proc. EUSIPCO 2015, pp. 1103-1107,Sep. 2015. [poster]

 

小型のマイクロホンシステムを用いた低計算コストの音源分離

携帯端末や自律移動型ロボットに音源分離技術を応用する際には、小規模なマイクロホンアレイでかつリアルタイムで動作可能なアルゴリズムの実現が求められます。小林研究室では、沖電気工業株式会社との共同研究で、小型のマイクロホンアレイシステムを用いた低計算コストの音源分離アルゴリズムを開発しました。

ROBISUKE:音源分離(2008)頭部に正方形のマイクロホンアレーを持って,指向性雑音,拡散性雑音,ロボット自身の声など様々な雑音を除去することができる。このデモでは,指向性雑音である音楽,拡散性雑音であるエアコンの雑音,ロボットの声などが,分離処理によってきれいに除去されている。

Posted by 早稲田大学|小林哲則研究室 on 2012年9月10日

Related Publications

  • Tetsuji Ogawa, Shintaro Takada, Kenzo Akagiri, and Tetsunori Kobayashi, “Speech enhancement using a square microphone array in the presence of directional and diffuse noise,” IEICE Trans. Fundamentals, vol.E93-EA, no.5, 926-935, May 2010.
  • Kosuke Hosoya, Tetsuji Ogawa, and T. Kobayashi, “Robot auditory system using head-mounted square microphone array,” Proceedings of the 2009 IEEE/RSJ International Conference on Intelligent Robots and Systems, IROSS2009, pp.2736-2741, Oct. 2009.

© 2015 Perceptual Computing Group, Waseda University. All Rights Reserved

page-projects