スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

#0122_

ボカランは対象じゃなかったみたいです。一人で盛り上がってた自分が恥ずかしい><
いつか、真っ向勝負の「喋らせてみた」で、ボカランに載る日を夢見ることにします。いい目標ができました。



動画で、「誰かが作りそう」的なコメントをいっぱいいただきました。早速作ってみた人やUTAUでやってみた人もいらっしゃいます。あなた達仕事が早いな!(UTAUの人は以前からやってらっしゃったようですが)

そんなわけで、私も、みくみくトークを作るのに、何が必要なのか?技術的課題は何なのか?を素人なりに考えてみました。
ここではソフトウェアの機能を、比較的簡単な段階から3段階に分けて妄想しています。

①言語に加えて、文法情報も与えると、適切な音声を出力する、というレベル
喋らせたい言葉の入力のみでなく、形態素解析/構文解析/意味解析に至るまで、ユーザーが指定する。すると、ミクさんが大変流暢な日本語を喋ってくれる。そんなソフトウェア。当然ながら、ユーザー自身が言語を分析できる能力を持っている必要があるので、敷居は高いです。ただし、ユーザーの言語分析能力が十分であれば、完全な発声を行ってくれます。
一から十までお世話してあげなきゃいけなかったところから比べると、皆さんのボーカロイドが幾分手間のかからない子にレベルアップします。また、一方で言語認識に必要な膨大なデータベースは不要ですので、実装はかなり楽になる気がします。ただし、アクセント・イントネーションのデータやそれを音声データに表現するシステムは必要です。
いや、そもそもアクセントの指定もユーザーがやればいいのか…。softalkにアクセント記号と区切り記号を与えるのと同じでいいんですもんね。
頑健性(いろいろな状況に対応できる性質)がゼロなので、自然言語処理屋さんから見ると、この段階のソフトウェアはあまり夢のないように思えるかもしれません。しかし、「喋らせてみた」をやっている者からすれば、ひたすら面倒くさいピッチ曲線の引きなおしや、音符の配置を省けるので、作業効率は10倍くらいになるでしょう。出来上がった音声データの出力形式がvsqファイルならなお良いですね。出来上がったものを自由に編集もでき、ユーザー側にも表現の余地が生まれます。
私個人としてはコレが一番欲しいんですが、たぶん著しく需要がないと思うので、このソフトウェアが実現されることはないでしょう。

②言語を与えると、文法を解析し、適切な音声を出力する、というレベル
ユーザーは喋らせたい言葉を入力するだけでよく、あとはミクさんが勝手に喋ってくれる。やれと言ったら自分でやれる賢い子。あなたの命令には「ご主人様のお気に召すままに」と従順に答えてくれます。ボーカロイドとのマスタースレーブな関係がお望みのあなたにぴったり。
言い方を変えると、ただのテキストトゥスピーチです。これだけなら、近所のパソコン屋さんで1万円ちょっとお金を出すだけで買えるレベルです。
頑健性は高まり、ユーザーに言語分析能力を要求しない点は優れています。しかし、出力される音声の正確性が、文法解析能力に左右され、それがシステム全体の質を左右する点が難しいです。
これも出力結果がおかしかったら、ユーザーが修正できるようにするなどすると、幾分使いやすくなる気がします。というか、まんまVOICEROIDです。うちのアイアイも、適宜間違いをきちんと直してあげると、かなり正確な抑揚で読み上げをしてくれます。
アイアイは賢いなぁ

感情モードなど、既存のテキストウスピーチにない機能が盛り込めれば、表現の幅も広がって魅力的なソフトウェアになる気がします。
ともかく、ゲームの実況動画のお供に使うという用途であれば、十分実用的だと思います。

③自ら学習し、自ら音声を出力するというレベル
スタンダローンです。賢いミクさんは、「これを読んでご覧」と言って本を差し出すと、そこに書かれた文章から、ありとあらゆる言語知識を吸収します。
かくして知能を身につけたミクさんは、今や自立的な行動力を手にし、我々人間に反逆を始めるのだっ!SFだね!
自ら学習するので、開発者が気の遠くなるような手間をかけてデータベースを構築する必要が無くなります。ただし、学習が適切に行われない場合、適切な音声出力を実現することはできないでしょう。優れた学習アルゴリズムを考える必要があります。言語のみに留まらず、非言語的な情報(例えば視覚的な情報)も学習できるようになれば、もう立派なAIです。
自然言語処理屋さんの理想型がまさにこんな感じなのではないでしょうかね。ただ、私個人としましては、「言語学者がヒーコラ言いながら言語の研究を行っているのに、我々人間は言語の仕組みについて分からないことだらけ。それなのに、いきなりコンピューターが言語を理解できるようになったりするのかしら?」という率直な疑問があります。その辺も、コンピューターの処理性能が向上すれば自然と解決するものなんですかね?まぁ、チェスや将棋でコンピューターが人間を凌駕する時代ですから、そう遠くないうちにそういう日が訪れるのかもしれません。


そんなわけで、どのレベルのソフトウェアを目標とするかにもよるんですが、②水準の「初音ミクが自動で喋るツール」の実現可能性は非常に高いと思います。
どうしよう、本当に「喋らせてみた」の人たちってやることなくなっちゃうんじゃないだろうか。おろおろ。

コメント

管理人のみ閲覧できます

このコメントは管理人のみ閲覧できます

お返事

>管理人のみ閲覧のひと
ポーランドから遠路はるばるようこそ!
残念ですが、mikumikutalkは、配布しておりませんし、配布予定もありません。
ご了承ください。

コメントの投稿


管理者にだけ表示を許可する

トラックバック

http://spectacler.blog104.fc2.com/tb.php/124-9845125b
この記事にトラックバックする(FC2ブログユーザー)

前頁 / 翌日  | ホーム |  前日 / 次頁

お知らせ

2013/01/19:第10回MMD杯予選動画を投稿しました

プロフィール

なまえ:すぺくたくら
初音ミクに言葉を教えています。
あとMMDも。あとメガネ。
>> マイリスト  >> 自己紹介
メール:spectacler(あっとま)gmail.com

ミクさんから一言

twitter

カウンター

相互リンク

カレンダー

07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -

動画

静画

最新コメント

最新記事

月別アーカイブ

カテゴリ

動画製作 (200)
言葉の話、音声の話 (11)
喋らせてみた (105)
メタセコイアでメガネを作ろう (39)
その他 (369)
MMD (217)
月間MVV(最優秀動画賞) (15)
初回 (1)
音声編集 (4)
ニコ生 (31)
プログラミング (19)
メタセコイア (12)

リンク

このブログをリンクに追加する

最新トラックバック

検索エンジン向けキーワード

Vocaloid/初音ミク/喋らせてみた/トークロイド/ニコニコ動画/MikuMikuDance/MikuMikuTalk/みくみくトーク/みくみくとーく/ミクミクトーク/ダウンロード/DL

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。