早稲田大学 知覚情報システム・メディアインテリジェンス研究室

アーカイブ 2024年

招待講演

2025/01

小林哲則,“会話のできるロボットと身体を持った会話システム,” 日本音響学会研究発表会講演論文集,pp.XXX-XXX,March 2025.(to appear)

2024/11

鈴木駿吾,“英語教育における対話型AIの可能性:高校・大学での実践例と共に,” 愛知県高等学校英語教育研究会研究大会[第一部],Nov. 2024.

2024/11

鈴木駿吾,“AI技術を活用した診断評価:スピーキング学習の個別最適化とは?,” 愛知県高等学校英語教育研究会研究大会[第二部],Nov. 2024.

2024/08

鈴木駿吾,“対話指向英語スピーキング能力自動判定システムの開発,” The 48th KATE Annual Convention (第48回関東甲信越英語教育学会),Aug. 2024.

学術論文

2025/02

Ryuki Matsuura, Shungo Suzuki, Kotaro Takizawa, Mao Saeki, Yoichi Matsuyama, “Gauging the validity of machine learning-based temporal feature annotation to measure fluency in speech automatically,” Research Methods in Applied Linguistics, vol. 4, no. 1, pp. 1–23, April 2025.

国際会議

2025/01

Yosuke Higuchi, Tetsuji Ogawa, Tetsunori Kobayashi, “Harnessing the zero-shot power of instruction-tuned large language model for guiding end-to-end speech recognition,” Proc. 2025 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2025), pp.XXXX-XXXX, April 2025. (to appear)

2025/01

Yoshihiko Hayashi, “Evaluating LLMs’ capability to identify lexical semantic equivalence: Probing with the word-in-context task,” In Proceedings of the 31st International Conference on Computational Linguistics (COLING 2025), pp. 6985–-6998, Jan. 2025.

2024/12

Takuya Wakayama, Taiki Inoue, Jun Ogata, Makoto Iida, Tetsuji Ogawa, “A foundational model for precise and robust wind turbine condition monitoring via viration signals,” Proc. 23rd International Conference on Machine Learning and Applications (ICMLA2024), pp.697-704, Dec. 2024.

2024/12

Sayaka Toma, Tomoki Ariga, Yosuke Higuchi, Ichiju Hayasaka, Rie Shigyo, Tetsuji Ogawa, “Differences between singer and speaker verification: Training singer feature representation extractor utilizing singing voice characteristics,” Proc. Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2024 (APSIPA2024), Dec. 2024.

2024/12

Tomohiro Hayashi, Riku Ogino, Kohei Saijo, Tetsuji Ogawa, “What to refer and how? – Exploring handling of auxiliary information in target speaker extraction,” Proc. Asia-Pacific Signal and Information Processing Association Annual Summit and Conference 2024 (APSIPA2024), Dec. 2024.

2024/12

Haruki Konii, Teppei Nakano, Yasumasa Miyazawa, Tetsuji Ogawa, “Leveraging data from vast unexplored seas: positive unlabeled learning for refining prediction area in good fishing ground prediction,” Proc. 27th International Conference on Pattern Recognition (ICPR2024), pp.143-158, Dec. 2024.

2024/11

Kota Mochida, Teppei Nakano, Mari Wakabayashi, Tomomi Sato, Tetsuji Ogawa, “Parents-in-the-Loop Learning for Emotional State Estimation Models in Children with Profound Intellectual and Multiple Disabilities,” IEEE-EMBS International Conference on Biomedical and Health Informatics (BHI2024), Nov. 2024.

2024/10

Sayaka Toma, Tomoki Ariga, Yosuke Higuchi, Ichiju Hayasaka, Rie Shigyo, Tetsuji Ogawa, “Exploring impact of prioritizing intra-singer acoustic variations on singer embedding extractor construction for singer verification,” Proc. The 27th Conference of the Oriental COCOSDA (O-COCOSDA2024), Oct. 2024. [Best Paper Candidates]

2024/09

Mao Saeki, Hiroaki Takatsu, Fuma Kurata, Shungo Suzuki, Masaki Eguchi, Ryuki Matsuura, Kotaro Takizawa, Sadahiro Yoshikawa, Yoichi Matsuyama, “InteLLA: Intelligent Language Learning Assistant for Assessing Language Proficiency through Interviews and Roleplays,” In Proceedings of the 25th Annual Meeting of the Special Interest Group on Discourse and Dialogue (SIGDIAL2024), pp. 385–399, Sept. 2024.

2024/09

Michihiro Nakata, Sawa Ohyoshi, Teppei Nakano, Tetsuji Ogawa, “Construction of individual tracking dataset for developing foundational models in calving sign monitoring for beef cattle,” Proc. The 11th European Conference on Precision Livestock Farming (ECPLF2024), pp.1625-1632, Sept. 2024.

2024/09

Nahomi Kusunoki, Yosuke Higuchi, Tetsuji Ogawa, Tetsunori Kobayashi, “Hierarchical multi-task learning with CTC and recursive operation,” Proc. The 25th Annual Conference of the International Speech Communication Association (INTERSPEECH2024), pp.2855-2859, Sept. 2024.

2024/08

Takuya Wakayama, Taiki Inoue, Jun Ogata, Makoto Iida, Tetsuji Ogawa, “Normal with occasional anomalies: Feature extraction for detecting non-stationary abnormal events in wind turbines,” Proc. the 32nd European Signal Processing Conference (EUSIPCO2024), pp.2012-2016, Aug. 2024.

2024/08

Kota Mochida, Teppei Nakano, Shinya Fujie, Mari Wakabayashi, Tomomi Sato, Tetsuji Ogawa, “Exploring robust and explainable design for facial expression-based emotional state estimation in children with profound intellectual multiple disabilities,” Proc. the 32nd European Signal Processing Conference (EUSIPCO2024), pp.481-485, Aug. 2024.

2024/05

Yoshihiko Hayashi, “Reassessing semantic knowledge encoded in large language models through the word-in-context task,” In Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp. 13610-–13620, May 2024.

2024/04

Kazuki Matsumoto, Kohei Yatabe, “Determined BSS by combination of IVA and DNN via proximal average,” Proc. 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2024), pp. 871-875, April 2024.

2024/04

Tomoki Ariga, Yosuke Higuchi, Kazutoshi Hayasaka, Naoki Okamoto, Tetsuji Ogawa, “Parody detection using source-target attention with teacher-forced lyrics,” Proc. 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP2024), pp.1151-1155, April 2024.

研究会・シンポジウム

2025/01

佐藤裕明,佐久間旭,菅野竜雅,熊野正,河合吉彦,小川哲司,“Evidential deep learningを用いた不確実性に基づくストリーミング音声認識,” 電子情報通信学会研究報告 (SP),vol.XXX,no.XX,SP2024-XX,pp.XXX-XXX,March 2025.(to appear)

2025/01

矢部拓真,八重樫萌絵,中野鐵兵,小川哲司,“音質主観評価における評価者選抜のための音声サンプル選定の重要性,” 電子情報通信学会研究報告 (SP),vol.XXX,no.XX,SP2024-XX,pp.XXX-XXX,March 2025.(to appear)

2024/12

松本和樹,⽮⽥部浩平,“Projection Back制約付きLog-Det項の近接作⽤素と優決定ブラインド⾳源分離への利⽤,” 第39回信号処理シンポジウム,P2-17,Dec. 2024.

2024/12

楠奈穂美,樋口陽祐,小川哲司,小林哲則,“再帰的フィードバックを用いた階層的 End-to-End 音声認識,” 情報処理学会研究報告 (SLP),vol.2024-SLP-XX,no.XX,pp.XXX-XXX,Dec. 2024.

2024/12

佐久間旭,佐藤裕明,菅野竜雅,熊野正,河合吉彦,小川哲司,“発話被りを含む会話音声認識のための多話者CTC損失関数の検討,” 電子情報通信学会技術研究報告 (SP),vol.XXX,no.XX,SP2024-XX,pp.XXX-XXX,Dec. 2024.

2024/12

平田瑞葵,藤江真也,小林哲則,“役割情報付与に基づく重要文強調音声合成 ーピッチ予測の重みづけによる強調度合の制御,” 情報処理学会研究報告 (SLP),vol.2024-SLP-XX,no.XX,pp.XXX-XXX,Dec. 2024.

2024/12

樋口陽祐,小川哲司,小林哲則,“End-to-End音声認識における指示チューニングされた大規模言語モデルの活用,” 情報処理学会研究報告 (SLP),vol.2024-SLP-XX,no.XX,pp.XXX-XXX,Dec. 2024. [シンポジウム奨励賞][若手奨励賞]

2024/11

若山拓矢,井上太揮,緒方淳,飯田誠,小川哲司,“WindVibraTransformer:振動信号による精密かつ頑健な風車状態監視のための基盤モデル,” 第46回風力エネルギー利用シンポジウム,A1-05,Nov. 2024.

2024/11

倉田楓真,江口政貴,佐伯真於,鈴木駿吾,松山 洋一,“インタビューエージェントの関係構築的対話戦略が言語パフォーマンスに与える影響,” 第15回対話システムシンポジウム,Nov. 2024. [若手優秀賞]

2024/08

望田康太,中野鐵兵,若林麻里,佐藤朝美,小川哲司,“重症児感情状態推定モデル構築のためのフィードバックサイクルの検討:人の「見守り」による効率的なモデル構築,” 第27回画像の認識・理解シンポジウム (MIRU2024),IS-1-165,Aug. 2024.

2024/08

中田道寛,中野鐵兵,小川哲司,“状態変化の頻度情報の抽出と家畜の映像監視のための特徴表現としての利用,” 第27回画像の認識・理解シンポジウム (MIRU2024),IS-3-142,Aug. 2024.

2024/06

当間佐耶佳,有賀智輝,樋口陽祐,早坂一寿,執行里恵,小川哲司,“歌唱者埋め込み表現抽出器の構築において歌唱者内の音響変動を重要視することの効果の検証,” 情報処理学会研究報告,vol.2024-SLP-152, no.60, pp.331-336,June 2024.

全国大会

2025/01

当間佐耶佳,有賀智輝,樋口陽祐,早坂一寿,執行里恵,小川哲司,“歌唱音声の特性を考慮した歌唱者照合のための頑健な特徴抽出器の構築,” 日本音響学会研究発表会講演論文集,pp.XXX-XXX,March 2025. (to appear)

2025/01

菅野竜雅,佐藤裕明,佐久間旭,熊野正,河合吉彦,小川哲司,“発音プロンプトと辞書を活用したEnd-to-End音声認識のキーワード認識精度改善手法,” 日本音響学会研究発表会講演論文集,pp.XXX-XXX,March 2025. (to appear)

2025/01

楠奈穂美,樋口陽祐,小川哲司,小林哲則,“階層的マルチタスク学習とContextual Biasingを用いたEnd-to-End音声認識, ” 日本音響学会研究発表会講演論文集,pp.XXX-XXX,March 2025. (to appear)

2025/01

谷口友紀,藤江真也,小坂直敏,小林哲則,“テンポのずれに関する知覚実験,” 日本音響学会研究発表会講演論文集,1-R-39,March 2025. (to appear)

2025/01

松本和樹,矢田部浩平,“重複した帯域の逐次的な分離による優決定BSSの高性能化,” 日本音響学会研究発表会講演論文集,1-Q-11,March 2025. (to appear)

2024/09

中田道寛,大吉佐和,中野鐵兵,春日良一,小川哲司,“RangeBoundTrack: 黒毛和種雌牛分娩監視映像データセット構築のための牛追跡,” 日本畜産学会 第132回大会,IV-18-05,Sept. 2024.

2024/09

菅野竜雅,佐藤裕明,佐久間旭,熊野正,河合吉彦,小川哲司,“低頻度語のためのプロンプトを活用した音声認識,” 日本音響学会研究発表会講演論文集,2-Q-38,Sept. 2024.

2024/09

松本和樹,山田宏樹,矢田部浩平,“Projection Backを距離射影で扱う制約付き優決定ブラインド音源分離,” 日本音響学会秋季研究発表会講演論文集,1-11-4,Sept. 2024.

© 2015 Perceptual Computing Group, Waseda University. All Rights Reserved

page-archive-2024