Innovative Tech:
このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。
北京理工大学とUAEのInception Institute of Artificial Intelligence(IIAI)、米ジョージ・メイソン大学の研究チームが2019年11月に発表した新技術「Comic-Guided Speech Synthesis」は、漫画に登場するキャラクターが発するせりふを、適切な感情をこめた音声に変換し、出力する手法だ。
漫画本のページを読み込ませると、各キャラクターが発している吹き出しの中のせりふを分析し、ストーリーの流れに沿って音声を合成する仕組み。
分析と発話に当たっては、「Comic Visual Analysis」「Comic Speech Synthesis」の2つの技術を使用する。各技術の詳細は以下の通り。
- Comic Visual Analysis:漫画本のページを分析し、パネル・吹き出し・テキストなどを抽出した上で、各要素を物語の順序に並べ替える。その上で、吹き出しと、せりふの主であるキャラクターをひもづける。続けて、各キャラクターの性別と年齢、せりふの内容と対応する感情(幸せ、悲しみ、怒りなど)を識別する。
- Comic Speech Synthesis:Comic Visual Analysisの分析に基づき、性別・年齢・感情と対応する、各キャラクターの音声を合成する。
これらの技術を用いることで、オーディオコミック制作の自動化、本から飛び出して話すARキャラクターの作成、話せる3Dアバターの生成、ゲームキャラクターのナレーション――など、さまざまな活用が可能になる。漫画とは異なる言語で音声を出力することで、外国語学習の手段としても利用できる。
関連記事
関連リンク
"漫画" - Google ニュース
January 08, 2020 at 07:30AM
https://ift.tt/2QT89Ha
漫画キャラのせりふを、感情のこもった音声合成に変換 北京理工大学などが新技術 - ITmedia
"漫画" - Google ニュース
https://ift.tt/2Yphqd6
Shoes Man Tutorial
Pos News Update
Meme Update
Korean Entertainment News
Japan News Update
No comments:
Post a Comment