古文書解読音声認識テキストのアーカイブ |
「くずし字」で記録された古文書のデジタル画像から自動翻訳する研究を推進する. この研究目的の中で西浦Gでは熟練者の参画によって得られる読上げ音声のテキスト化を担当する. 特に古文書読み上げ音声に基づき音響モデルを構築もしくは適応させることで円滑な読み上げ音声のテキスト化を実現する. 専門家集団である熟練者の翻刻プロジェクトを結びつけ,熟練者による古文書テキストアーカイブに尽力する. |
次世代スポットエリア再生・収音 |
音の放射範囲および到達距離を制御可能なピンスポット再生スピーカシステム、および騒音環境下でも的確に目的音のみを集音可能なピンスポット集音マイクロホンシステムを含む次世代ピンスポットオーディオシステムの総合開発を展開する.特に超音波スピーカを活用した世界初の音のピンスポット再生の実現に加えて、遠方音を集音可能な光レーザマイクロホンを用いて人の喉の振動を遠方から読み取ることで,周辺騒音に頑健なピンスポット集音にも挑戦し,次世代ピンスポットオーディオシステムの総合開発を試みる. |
運動の生活カルチャー化により活力ある未来をつくるアクティブ・フォー・オール拠点 |
空間価値を変える新しいスポーツ健康技術(スマートウェア技術,空間シェアリング技術,運動誘導/継続技術)と,寝たきりゼロを目指す「ロコモの見える化と予防法の開発」を行う.「運動」を媒介に「スポーツ・運動」と「医療」の両側面から健康を維持・増進し,全ての人々をアクティブな状態へ誘導する.人々の時間と空間を共有し,「日本の誇るべき絆社会」を実現する.このプロジェクトにおいて西浦研では空間共有を実現するための音像制御技術を担当する.超音波スピーカ技術を活用し,みんなが運動したくなる空間づくりを目指し,健康の増進に繋げる計画である. |
次世代人工知能と記号学の国際融合研究拠点 |
次世代人工知能社会に向けた研究拠点形成を念頭に,自動運転車,家庭用ロボット,記号論および未来のAI社会の横断的な研究強化を目的として,人間機械共生のための音表象技術の革新を追求する.具体的には機械とユーザーのスムーズな意思疎通の実現に向けて高度音声インタフェースの開発に着手する.耐雑音残響技術や遠隔発話音声受音技術はもちろんのこと,発話による誘発振動を光レーザーで読み取る光レーザーマイクロホンの導入も視野に幅広い音表像技術の革新を目指す. |
感覚統合をコアとした健康行動継続学の創成 |
「そこにいるだけで動きたくなる空間のモデル構築とその実装メカニズムの解明や技術開発」を目標に,社会科学,経営学,工学,情報学,スポーツ科学,デザイン科学,心理学など多岐にわたる学問分野を横断することで運動空間創成科学という新しい学際領域の確立を目指す.本研究グループは視覚,聴覚,嗅覚の3つの感覚を取り巻く知覚環境を制御する新たなVR(バーチャルリアリティ)技術を中心に知覚統合による運動継続モデルを構築する.特に西浦研では,聴覚VR技術を中心に担当し,音像ホログラムを含む新しい音響デバイスおよび音響コンテンツの開発などを担当する. |
非線形再帰フィルタの拡声通話機器への応用 |
近年, テレビ会議システムやスマートフォンの発展に伴い, 拡声通話機能が発達し, アプリケーションとして多くの場面で利用されている. 特に, テレワークなど多様な働き方を支援する上で, 拡声通話機能は必須である. しかし, 拡声通話において, 音響エコーの発生が問題となる. 音響エコーは, スピーカから出力された音声がマイクで収音され, その音声が発信側に返ってしまう現象である. 音響エコーが重畳することで, 本来伝達したい音声の聞き取りが困難となる. 従来の音響エコーキャンセラでは, スピーカ部の歪み発生の性質 (非線形性) を考慮していないため, エコー抑圧性能は限定的である. そこで, 本研究では, 出力部であるスピーカの非線形性を補償するエコーキャンセラを研究し, エコー抑圧性能の改善を図る. |
騒音の快音化 |
音は拡散し回折する性質を持っているため,従来の騒音制御技術等で完全に抑圧することは非常に困難である.また,騒音はそのエネルギーだけでなく音色(周波数特性)も受聴者のストレスを増大する主要因となっており,騒音削減後の抑圧信号の周波数特性によっては,小さい騒音エネルギーであっても不快と感じる.そこで,これまでの騒音を削減する考え方に加えて,音楽分野にて研究が進む和音の考え方を取り入れた新しい騒音解決策を提案し,「騒音環境の快音化」という新しい研究パラダイムの確立に挑戦する. |
ウェアラブルオーディオスポット |
イヤホン等に代わる新しい音響再生デバイスとして,ユーザの耳を塞ぐことなく,音楽をユーザの耳元でのみ再生可能なウェアラブルオーディオスポットの研究を試みる.特に@ユーザが所望の音楽等と周辺の音環境の両方を的確に知覚できる,Aユーザに過度な身体的負担を与えない,B周囲に対して所望の音楽などの音漏れがない,を実現することで、将来的にはイヤホン等に代わる手軽な音響デバイスとしての普及を目指し,事故のない明るい社会作りに貢献する. |
ピンスポット目覚まし時計 |
周囲に気づかれることなくユーザのみに報知音を提示可能なピンスポット目覚まし時計の技術開発を試みる.具体的にはパラメトリックスピーカを活用し,スピーカの近傍でのみ音を再生可能な技術(近距離音響再生技術:1台ユニットを用いて遅延を付与することで、側帯波とキャリア波の分離放射による近距離オーディオスポットを実現)へと昇華させることで,周囲に気づかれることなくユーザのみに報知音を提示可能なピンスポット目覚まし時計を実現する. |
危機検知システム |
少子高齢化・核家族化が急進している日本では,家庭用ロボットが国民の日常生活を支援するための取り組みが推進されている.核家族を想定した場合,このようなロボットは,家事・移動などの生活支援に加えて,単身生活者を犯罪や災害などの危機的状況から守る役割も期待される.本研究では聴力が低下した高齢者に代わって,音環境を自動推定(音声,生活音,異常音を理解できる)しながら危機的状況を検知するシステムの開発に挑戦する.具体的には,はじめに家庭内に存在する不要雑音を除去した音響信号から音環境を適切に推定できる音声・音響特徴量を特定する.その後,これらの音声・音響特徴量を用いて音環境をリアルタイムで推定し,その中で非日常音(異常音や叫び声など)が発生したときに危機的状況として検知するアルゴリズム,およびシステム開発に取り組む計画である. |
音像ホログラム |
本研究では,ある特定の領域にのみ音波を放射できるパラメトリックスピーカを改良し,音空間の任意の場所における立体的な音像(3D音像ホログラム)を実現する.特に放射面を凸面から凹面まで自由に形状変形可能なフレキシブルパラメトリックスピーカを開発した上で,複数のフレキシブルパラメトリックスピーカを用いて 「キャリア波」と「側帯波」を分離放射することで音空間に3D音像ホログラムを構築する.さらに社会における活用シーンも調査・検討(社会実装)することで,音空間上の任意の場所に構築可能な3D音像ホログラムの総合開発を試みる. |
音空間分離システム |
鋭い指向性で音波を放射できるパラメトリックスピーカを改良し,反射波が存在する任意の空間において同時に複数の受聴者に対して個別の音空間(Multi-in-One型音空間構築)を実現する.特に,パラメトリックスピーカが超音波トランスデューサの集合体である点に着目したアレー制御に基づく指向性制御可能なパラメトリックアレースピーカを改良した上で,パラメトリックアレースピーカを用いて「キャリア波」と「側帯波」に対してそれぞれ異なるアレー制御を独立に行うことで,同一の空間における音空間分離システムを構築する計画である.パラメトリックスピーカを用いた極小領域オーディオスポットの研究を発展的に拡張させることで,同一の空間に複数の音空間を構築し,それ以外の空間が静穏となる音空間分離システムの開発を試みる. |
話者ダイアライゼーション |
話者ダイアライゼーションとは複数人会話において「いつ誰が発話したのか」を推定する問題を指す.話者ダイアライゼーションに関する研究は2000年以降数多くあるが,いずれの研究も静かな環境で行われる会議や,映画やテレビ番組など発話のSN比が大きい場合を想定したものであった.そのため,雑踏など大きな雑音が混入する環境や残響が多い環境では推定精度が劣化する.本研究では残響・雑音環境における推定精度改善を目指す.具体的には,雑音により歪んだ音声の空間情報をいかに復元するかに焦点を当てる.この研究により,どのような環境でも複数人が絡む複雑な会話の分析ができるようになり,より人間らしい知的対話ロボットへの適用が期待される. |
ドーム型音像プラネタリウム |
本研究では,世界に先駆けて提案した「音像プラネタリウム方式」をさらに発展させ,「ドーム型音像プラネタリウム方式」を用いて臨場感溢れる3D音場生成に挑戦する.この方式は多数のスピーカを球状の筐体に配置し,そこから発生する音信号を部屋の壁面に反射させて,任意位置での音像定位を実現する方式であるが,2次反射以降の反射音の影響で所望の音像位置にも虚音像が生成するという問題があった.そこで本方式の有効性を最大限発揮できる半球ドームを構築し,2次反射音を積極的に床面に集め吸音することで、高次反射の影響の少ない音像プラネタリウムを実現する.本方式の採用により,利用者は全員がヘッドホンを装着することなく,自由な位置で聴覚的MRを体験することができる. |
多世代交流型運動空間による健康増進研究拠点 |
大人から子供まで多世代が「そこにいるだけで動きたくなる空間のモデル構築とその実装メカニズムの解明や技術開発」を目標に,社会科学,経営学,工学,情報学,スポーツ科学,デザイン科学,心理学など多岐にわたる学問分野を横断することで運動空間創成科学という新しい学際領域の確立を目指す.本プロジェクトでは「持続性ある健康な社会の実現」に貢献する4つの研究拠点を形成し,西浦研ではグループ1(技術コア)を取りまとめ,特に音響技術を用いて動きたくなる空間の構築や新しい音響デバイスおよび音響コンテンツの開発など実施する. |
球形パラメトリックスピーカ |
本研究では,個々人が知覚する異なる3次元音場を独立に制御・構築する世界初の音像再生デバイスの開発に挑戦する.これまでのパラメトリックスピーカは鋭い指向性を実現するものの,超音波素子が平面上に配列されていたため,移動音源の表現や指向性の制御が困難となり,制御できる領域が制限されていた.そこで,超音波素子を球面上に配列した球形パラメトリックスピーカを設計し,各素子を選択的かつ独立に制御することで,それら問題点の解決を狙う.そして,必要な情報または音場を個々に提供することでより多くの人に対して快適な音環境の構築を目指す. |
立体音響システム |
本研究では,スピーカ配置に自由度があり,かつ受聴者の移動を含む様々な動きに追従できる小規模な立体音響再現システムの実現を目指す.そこで,音響情報の提示と受聴者の位置の検出にパラメトリックスピーカ(超音波スピーカ)を利用することを検討する.まず,位相干渉に基づく距離推定(室内のような近距離においても利用可能な音響レーダ技術)を応用することで受聴者の耳元位置をリアルタイムで推定してトラッキングする.次にトラッキングした両耳元位置に対してパラメトリックスピーカを利用した音響ビームの指向性制御によりそれぞれ頭部伝達関数を考慮した音響情報を提示する立体音響システムを提案する. |
外乱学習型音声認識システム |
本研究では,音声認識性能を低下させる外乱要因を自動で推定し,外乱に頑健な音声認識システムの構築を試みる.雑音,残響および話者の個人性を自動で推定し,推定内容に基づいて外乱対策を適切に講じることで音声認識システムは常に最大の性能を発揮できる.そして,いつでも,どこでも,誰でも頑健に動作する音声認識システムを搭載した「ユビキタス音声入力インタフェース」を実現することで,万人にとって使い勝手の良い理想的な情報機器操作環境を提供することを目指す. |
マルチモーダル情報統合型知的音響サーベランスシステム |
本研究では,ビデオカメラやマイクロホン,距離センサなどの多様なセンサを用いて,危機状況を自動的に検知して周囲に報知する「マルチモーダル情報統合型知的音響サーベランスシステム」の構築に挑戦する.従来の単一のセンサを用いた危機検知法は,環境毎に異なる外乱の影響により,検知精度が低下する問題がある.そこで本研究では,様々なセンサで取得した信号を相補的に統合することで,どのような環境においても外乱に対して頑健な危機の自動検出法を確立し,誰もが安心・安全に暮らせる社会の実現を目指す. |
京都工芸文化の研究 |
デジタル技術の長足の進歩に応じて、文化・芸術分野でもデジタル資源の共有化が必須となっており、本研究プロジェクトでは京都の工芸品の音響復元を試みる。特に歴史的に価値の高い工芸品の破片等から音響シミュレータを用いて当時の音色の復元に挑戦する。研究のスタンスとしてまずは空間放射音に対して高性能にシミュレート可能な音場シミュレータを構築した上で、固体内振動音に対する応用を検討する。その後、工芸品の一部破片を基に必要なパラメータを計測し、完全体の工芸品の音響情報の復元に挑戦する。 |
運動を生活カルチャー化する健康イノベーション |
健康社会の実現を目指して,大学だけでなく企業や地域と共同で新産業の創出を目指す.この中で西浦研では「空間シェアリングシステムの事業化」を担当し,超音波スピーカやデジタルスピーカを用いて音で空間を顕在化する技術開発および事業化に挑戦する.本プロジェクトでは特に事業化に力を入れており,大学の研究シーズをニーズに合わせて社会還元することが重要となる.2013年11月現在では大学研究者に加えて,6社の民間企業に協力頂き,事業化に向けて日々研究を推進している.また,映像グループや着るだけで動きたくなるようなスマートウェア開発グループとコラボレーションし,さらに社会実装グループとも連携することで,社会ニーズに適した空間シェアリングシステムの構築を目指す. |
音環境理解 |
危機的状況を的確に検知して周囲に報知するシステムは,安全安心な社会基盤の構築には必要不可欠である.特に人は危機的状況下では叫ぶ習性があることから,本研究では叫び声や異常音などの危機情報を検知し周囲に報知する危機検知・警報システムの基盤形成を目的とする.叫び声の高精度な検出アルゴリズムに加え、検出した叫び声から危険状況を判断し,周囲に報知する警報音の設計まで包括的に研究を展開する.特に実環境における危機(異常音)情報全体を研究対象として,危機検知・警報システムの基盤形成を試みる. |
舞踊動作の記録・解析・表現 |
伝統芸能のなど無形文化財などのデジタルアーカイブ化を実現する。特に舞踊・演劇・祭礼等における複数人物による身体動作の記録・解析・表現において、モーションキャプチャで身体動作を計測するだけでなく、その際に生じる音響信号もあわせて多点計測技術を用いて高品質に収録することで、映像だけでなく音響信号に関してもデジタルアーカイブ化を試みる。特に同期した映像と音響の高精度なアーカイブ化が最終目標となる。 |
視聴覚融合型知的音響サーベランスシステム |
本研究では,ビデオカメラで取得した視覚情報とマイクロホンで取得した聴覚情報を併用することで,危機状況を的確に検知して周囲に報知する「視聴覚融合型知的音響サーベランスシステム」の構築を目指す.従来のビデオカメラのみを用いた危機状況検知には,画角や物体の重畳による死角が存在する問題がある.そこで,危機状況において発生する物が倒れる音や叫び声などに着目して,これらの聴覚情報を視覚情報とともに用いることで高精度な危機状況の自動検知を実現し,安全安心な社会基盤の構築を目指す. |
京都アート・エンタテインメントの時空散歩 |
本研究プロジェクトにおいて西浦研究室では「高忠実度音場記録による祇園祭お囃子の再現」を担当しており、祇園祭における山鉾巡行のCGにあわせて臨場感あふれる音響信号の構築を担当する。実際に船鉾の鉦(かね)や太鼓の音だけでなく、鉾の車輪のきしみや、沿道に詰めかけた観客のざわめきを忠実に再現することで高精度なデジタルアーカイブ化を目指す。昨年度WEBを用いて簡単に祇園祭の臨場感を体験できるバイノーラルシステムを構築した。今後サラウンド技術を用いてさらなる高臨場音場の構築を目指す。 |
音像プラネタリウム |
本研究では,全く新しい独自の「音像プラネタリウム方式」による3D音場生成を試みる.この方式は多数のスピーカを球状の筐体に配置し,そこから発生する音信号を部屋の壁面に反射させて,任意位置での音像定位を実現する方式である.本方式の採用により,利用者は全員がヘッドホンを装着することなく,自由な位置で聴覚的MRを体験することができる.本研究では,世界で初めて本方式を実現し,それを高臨場感MRシステムの基幹技術として用いることを目指す. |
聴覚バリアフリー |
聴力を自然に補う補聴器の実現を目的として,音声を明瞭化するための研究を行っている.本技術は,若年者の発話を高齢者を対象に明瞭化する技術だけではなく,高齢者の発話を若返らせる音声復元技術から構成される.従来の補聴器では,音量の増大が主な方法であった.一方本研究では,高齢者に対して聞き取りが容易な音色を生成することで,音量を上げずに音声聴取能力を改善する技術が目標となる. |
音場トランスクリプション |
音環境におけるあらゆる音イベントを文字として記録するだけでなく,発生位置や時刻情報なども合わせて構造化(これを音場トランスクリプションと呼ぶ)することで,音環境のアーカイブ化を試みる.サラウンドマイクロホンアレーにより高精度に音イベントを収録・検出することで,高精度な音場トランスクリプションシステムの構築を目指す.この技術が確立できれば,環境内の音イベントを構造的に把握することができるため,音響セキュリティーシステムや防犯システムなど「安全・安心」を支える基礎技術として期待できる. |
高品質音声分析変換合成法:TANDEM-STRAIGHT |
本研究は,衰えた聴力や声を取り戻すだけではなく,それらをより優れたものとするための支援技術の基盤確立を目的としている.立命館大学では,この研究を進めるために最も重要な技術となる音声分析変換合成法TANDEM-STRAIGHTの改良と評価を担当している.TANDEM-STRAIGHTは,元音声に匹敵する自然な音声を合成できる方式として提案された.現在も国内外の様々な研究機関が,音声モーフィングや声質変換用のツールとして利用している. |
歌唱デザインインタフェース |
CrestMuseプロジェクトでは,メディアアートやデザインの成立前提である共通了解性,および,音楽に代表される時系列メディアの認知特性に着目し,既存事例中のデザインの転写によってコンテンツ制作を支援する方式の開発を行っている.立命館大学では,歌唱加工を快適に行うために必要となる技術の提案と,使いやすいインタフェース設計に関する検討を行っている.本技術により,「○○風の歌い方」「声質をワイルドに」といった,人間のイメージに基づいて歌唱を加工できるようになる. |
サラウンドスピーカアレー |
次世代デジタルメディア時代に向けた新しい音響再生方式として、従来のヘッドホンシステムと5.1chサラウンドシステムの長所を融合した近接設置型サラウンドスピーカアレーシステムの実用化を目指す。このシステムはユーザの耳元に複数のスピーカを近接設置して高臨場音空間を構築するため、ヘッドホンシステムのような圧迫感を感じることなく、かつ5.1chサラウンドシステムのようなユーザの受聴位置に依存することもない。さらに頭部周辺に対して独立した音空間を構築できるため、隣り合う座席ごとに異なった音空間を構築できる。今後は映画館や自動車の座席としての利用を模索する計画である。 |
歌唱支援システム |
カラオケにおいて、使用者の歌い方を補正する技術、およびリアルタイムで動作するシステムの開発を行う。提案する技術は、Vocoderを基盤とした音声分析手法を用いて任意の人物の歌唱を分析し、その歌唱法を使用者の歌唱にリアルタイムで転写し合成することで、使用者の歌唱力補正を実現する。実装されたシステムを用いることで、使用者は誰でもプロ並の歌唱法で歌えることが期待される。本プロジェクトを担当した中野皓太くん(当時西浦研B4)は立命館大学情報理工学部2009年度父母教育後援会優秀賞を受賞し、学位授与式にて表彰された。 |
CENSREC 雑音下音声認識評価環境 |
「情報処理学会・音声言語情報処理研究会」のもとで「雑音下音声認識評価ワーキンググループ」として雑音下の音声認識を評価するために大規模なデータベースを収集し、それを利用した共通評価基盤の構築と配布を行っている。立命館大学では残響下音声認識評価環境"CENSREC-4"および雑音下発話区間検出評価環境"CENSREC-1-C"においてデータの収集を中心に重点的に活動した。本プロジェクトを担当した福森隆寛くん(当時西浦研B4)は立命館大学情報理工学部2009年度父母教育後援会教育賞を受賞し、学位授与式にて表彰された。 |
音声モーフィング |
音声を「高さ」と「声質」に分解し,他人の高さ・声質を任意の比率で混ぜ合わせ再合成する声質変換(これを音声モーフィングと呼ぶ)を実用的なツールとして実装するために必要となる枠組みの提案を目指している.従来音声モーフィングを実施するためには,音声の専門知識を有する熟練者が膨大な時間をかけて前処理を行う必要があった.この技術の確立により,これまで手動で行ってきた操作を全て自動化できる.そのため,専門知識を持たないユーザでも,ナレーションの加工といったコンテンツ制作をサポートするツールとして音声モーフィングを利用できるようになることが期待できる. |
三感融合型複合現実空間の構築 |
本研究では、「視覚」に「聴覚」と「触覚」を加えた「三感融合型」の複合現実感を検討した。西浦研究室では、このプロジェクトにおいて「聴覚」部門を担当し、実空間と人工空間を融合する音場シミュレータの開発などに貢献した。この音場シミュレータは様々な音環境を計算機において模擬可能なシステムであり、実際には存在しない音空間も生成できることから、今後引き続き研究を行う計画である。また本研究成果に関連して開発を担当した山田樹一郎くん(当時西浦研M2)が日本音響学会第20回ポスター賞を受賞し、西浦敬信准教授が第11回日本バーチャルリアリティ学会論文賞を受賞した。 |
ハンズフリー音声受音のための反射音の有効利用 |
従来、反射音・残響は抑圧すべき「雑音」として扱われてきた。しかし低次の反射音は直接音と極めて高い相関がある信号であることから、本研究では、低次の反射音を「雑音」として抑圧するのではなく、「目的音」として有効利用できないかという着想に基づいた新しい反射音有効利用の枠組みの確立に挑戦した。その結果、新しい残響尺度を提案し、ハンズフリー音声受音システムにおける反射音の有効利用の枠組みを提案した。 |
ハンズフリー音声受音用発話区間検出システム |
遠隔発話音声の高品質な受音に向けて、西浦研究室ではハンズフリー音声受音用発話区間検出システムの構築に従事した。この研究では、従来の時間情報に加えて音響空間情報を積極的に利用することで、周囲雑音に頑健な発話区間検出法を提案した。本研究成果はたくさんの学術雑誌論文や国際会議にて発表を行い、開発を担当した傳田遊亀くん(当時西浦研D2)と中山雅人くん(当時西浦研D3)が日米音響学会ジョイントミーティング若手研究者参加費助成プログラム受賞を受賞した。 |
音・映像の相補的統合によるハンズフリー音声受音システム |
空間内の音情報だけでなく映像情報を積極的に利用することにより、環境内の雑音や残響に頑健な発話者同定やハンズフリー音声認識・音声コミュニケーションの研究を行った。特に全方位カメラを用いた映像情報と音響情報を融合することで、複数話者における発話者位置推定システムについて重点的に研究を行った。また本研究成果に関連して開発を担当した傳田遊亀くん(当時西浦研D2)が電気通信普及財団テレコムシステム技術学生賞を受賞した。 |
更新日 令和 6年 4月 1日
Back