スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

# 0593_MikuMikuTalkができたよー

和泉聡さんがMikuMikuTalkを作ってくれました。わーい。
http://homepage3.nifty.com/akira-izumi/yahoo_ma21c/yahoo_ma.html

しかも現在進行形で改良中だそうです。胸熱。
実は原型はMikuMikuTalkなんかよりも前からあったようです。MikuMikuTalkの動画投稿後、実際に作ってみようという話はいくつか聞かれたんですが、その後具体的な進展を聞くことができなくてちょっぴり寂しかったんですよね。なので率直に嬉しい。

なんか最近別のところでも作ってる的な話を聞いたんですけどどうなんでしょう?種を撒いてから1年半近くなりますが、芽が出てくるとwktkします。



今日は生放送しました。今後も土曜日にやるつもりなんですが、来週さっそく帰省でお休みになりそうです。代替日を用意したいところ。
スポンサーサイト

# 0591_中国語トークロイド

中国語は声調言語です(唐突)。4種類の声調を用いて言葉を喋り分けています。これを四声と言います。

※以下こんな調子で進みますが、大学で半年間1コマだけ受講した中国語知識なので、話半分で聞いてください。

声調というのは声の高低調整のパターンのことです。中国語だとこんな感じ。
四声
画像はWikipediaさんから。てゆーか、詳しいこと知りたい人はとりあえずWikipediaへどうぞ。
四声の説明で必ずと言っていいほど使われるのが「マー」ですね。同じ「マー」でも一声では「媽」(母)、二声では「麻」(あさ)、三声では「馬」(ウマ)、四声では「罵」(ののしる)という意味になります。どうでもいいですけど、「ウマ」って和語と思われがちですが、漢語の「マー」が変化しただけですよね。
つまり、中国語では、同じ「マー」でも4つの声調を使い分けて、伝える意味を切り分けているわけです。
で、「マー」限らずあらゆる語がこの4パターンの声調で表現できるわけです。システマティックですね。

以上、中国語音声概論。
これを踏まえまして、この前ブログに乗っけた「皆さんこんぬつわ」を意味する「ニーメンハオ」をミクちゃんに言ってもらいます。
にーめんはおー
「ニー」は三声。
「メン」は軽声という、前の音に続く高さで発するものです。助詞とかに多いみたい。
「ハオ」は三声。
これを私なりにVOCALOIDエディタ上で表現するとこんな感じ。
ボーカロイドエディタ上のにーめんはおー
音符が苦手なので、PITだけで表現します。ちなみにPBSは10、音符の高さはF3(ファ)。
「ニー」は三声なので、低いところから後ろに行くにしたがって高く。
「メン」はそのまま高く。
「ハオ」はまた低いところから高いところへ…となるはずですが、挨拶の明るい調子を出したかったので、それほど低くなってないです。という感じ。後ろ側もうちょっとあげても良かったですかね。

聞いてみるとこんな感じ。


というわけで、あんまり四声表そのままじゃないです。その辺はアレンジってヤツね。
ちなみに実際の音声としてはグーグル先生の声も参考にしました。生声じゃないのが残念だねー。
大学で言語学を教わった時は「言語とは第一義的には音声言語なのであるから、文献ではなく、人の発する生の音声を研究対象とすべきだ」とか言われたはずなのに!現実的にそうでない言語学者はたくさんいますけどね。

以上、簡単中国語トークロイド講座でした!
結構胡散臭いからあんまり素直に真似しちゃダメだよ!

# 0581_メイキングその3「音声について」

動画の再生数も落ち着いてきて、私の感情の高ぶり具合も投稿直後モードから平常モードに移行しつつあります。
ぼちぼち配布物もまとめたい。



今日のメイキングは音声関係についてです。
BGM,声,効果音についての説明です。

◆BGMについて
今回、ナポレオンズの「あったまぐるぐる」をネタにすると決めた時、何かしら「回転」と関係のある曲をBGMとして使いたいと思いました。有名どころだと「ダブルラリアット」とか「ローリンガール」とかあるんですけどね。
一方でマジックをやるので(実際はやらないけど!)、楽しげな雰囲気も欲しかったです。
というわけで選んだのはOSTER projectさんの「@(シナモンロール)」です。


OSTERさんついでにもう1曲。

単純に好きな曲という理由で選びました!マジックしている裏で流れている曲としてはいい選択だと思います(実際はマジックやってないけど!)

実は正直なところ、投稿直前までミラクルペイントとの2択で迷いました。

つまるところ、Project Divaのイメージ(マジシャンモジュール)に乗っかるか、避けるかで、避ける方を選択したということです。

話の都合上、動画内ではBGMがかなりブツ切れだったので、良かったら元動画の方で聞いていってね!

◆声
ミク・ゆっくり・たこルカが喋ります。

そう、皆さん、見ててあんまり意識しなかったと思いますが、たこルカは巡音ルカの声です。とくに意味はないけど英語音源です。「パクッ」「ゲプ」のためだけに買いました。たぶん、そのうちまた使う日も来るでしょう。ちょっとエッチなネギトロ百合ストーリーとか作りたいです><

さて、ここで、どんな風に喋らせてるかにページを割いても、1日じゃ書き終わらないので割愛します。よかったら生放送でどんなふうに喋らせてるのか見ていってね。
今回は制作が長かったので、何度も繰り返し自分が作った声を聞く機会があって、そのたびに変なところを直すという繰り返しでした。やっぱり時間を置いて聞直すのはとても重要。
ただ、それでもなお、おかしいところあちこちありますねw MMDのモーションもそうなんですけど、ここおかしいって分かってる部分は自分でも分かってて、時間さえあればどれも直せるんです。まぁ、落としどころってヤツですね。

そうそう、動画ではブレスがしつこいってコメントを何度かいただきました。私もそう思ったんですが、事前におすかーさんに聞いてみたら「これでいいですよ」と太鼓判を押してくれたので、あれくらいの音量になりました!(←責任転嫁)
いや、一方で「ブレスがいい」という意見もあるんで、そんなに悪くないのかもしれません。
次はメリハリつけて、より自然な感じを目指します。

◆効果音
今回は効果音3分の1くらい自分で作りました。生の音を録音したものと、Cubaseで付属の音源を鳴らしたものなどがあります。

いくつか具体的挙げてみると
①バケツ(魔法の帽子)を地面に叩きつける音
②マジカルゆっくりキャッチの時のカカッ
③そのあとのファンファーレ
④バケツが飛んでいく時のピューン
⑤魔法なしで首が回る時のフィンフィフィンフィン

①は真冬の深夜にマンションの前の路上で録りました。お巡りさんに遭遇してたら確実にしつこい職質を食らってました。

④⑤はミクの声です。みなさん気づきました?ほんとうに「ピューン」とか「フィンフィンフィン」とか言わせてるんですよ。
やれ、ボーカロイドの人格がどうのと偉そうに語り、またそのボーカロイドに愛の言葉を語る私が、他方では道具として使ってたりするわけです。私にとって初音ミクとは何なのでしょうか。

自作じゃないものは借り物です。今回ニコニ・コモンズからいくつか使わせていただきました。マリオ風の効果音とかね。イメージに合った音が意外とすんなり見つかって使いやすかったです。

キラキラッとした音が動画内で3か所くらいあります。使いまわすとすぐ看破されて、チープさを露呈してしまうので、全部別のものを使ってます。1個は自作だった気がする。

短くてもセンスあるジングルとか作れれば、音声面ではぐっと良くなるんでしょうけど、なるべく身の程をわきまえてやっていきます。


音声については以上。
明日はMMDの話をします。1回じゃ済まないので、モーションの話とモデリング・モデル改造の話を分けて話そうと思います。

#0376_すぺくたくの初音ミク日本語指導日誌

大学で「ら抜き」は語形態変化の歴史的必然のように説明する講義を受けたことがあったので、いまだに文化庁が「ら抜き」を「誤り」としてとらえていることに逆に驚きます。

#0370_「え」

世界には数千という数の言語があります。まことに多様であります。
言語によって母音の種類も違います。アラビア語(正則アラビア語)のように3種類しかない言語もあれば、10数種類にも及ぶ言語もあります。たしか、フランス語なんかは使い分ける母音の数が多かったかと思います。
日本語の母音の数は5つですね。大昔は8つあったって皆さん知ってます?大学で国語学に触れる学生さんは真っ先に言葉の面白さを再認識する事項かと思います。気になる人は「上代特殊仮名遣い」でググってください(※異論も少なからずあるようです)。
このように弁別性をもった母音の数は言語よって異なり、また、時代によっても異なるものなのです。

時は流れて21世紀日本。母音の数はなんと4つになっていた! というのが今日のお話です。
あいうお
ホラね。

これはMMDの画面で、標準モデルの初音ミクVer2(あにまさ式ミクVer2)の口の表情のバリエーションの部分の抜粋です。「え」が無いのは「あ」と「い」の組み合わせで「え」を表現するためです。おそらく樋口Mさんは少ない項目の表情モーフで多様な表情を表現できることを良しとしたんでしょうね。
あにまさ式ミクはMMDの世界では「標準」ですので、表情に「え」を備えていないモデルも多いかと思います。Lat式ミクもその例に漏れず「え」がありません。

で、何が言いたいかというと、私としてはちょっと使いづらいという話です。
MMDにはVSQファイル(ボーカロイドのシーケンスファイル)を読み込んで、口の形を自動的に割り当てる機能がありますが、表情に「え」があっても自動的に「あ」と「い」を使って表情が割り当てられます(※今初めて試してみた!)。
まぁ、VSQファイル流し込む人はそれでいいんでしょうけど、私は基本的にやりません。うちのミクさん、実はVSQファイル通りに喋ってないので。全部音に合わせてキーフレームを打ってます。うまく合わなくてよく泣きますが!
でね、ミクさんが「え」段の音を発するたび、「あ」と「い」の二つの表情を操作するのが非常に億劫なんです。「え」1個でできる方が楽に決まってるじゃないですか。

そんなわけなので、今ちょうど、ちょっとしたモデル改造をしてる最中なので、「え」の表情を追加してみようと思ってます。ついでに「あ」「い」「う」「お」も自分好みに修正してみようかな。

こうして改造予定項目は増える一方。早々に動画作るのに戻って感を取り戻したいんだけどなぁ…。

#0316_モータープール~自動車だって水浴びはしたい~

本日2度目の更新です。

みなさんはモータープールという言葉をご存知でしょうか?岡山に一緒に旅行に行った会社の同期は「どういうプール?」って私に聞いてきました。
私はこの言葉は大学の言語学の講義で知りました。この文字を見かけるたびに、あの時のまとまりのない講義(←ひどい)が思い出されます。

結論を申しますと、モータープールとはかくのごときものです。
モータープール
あいにくの雨模様ですね。いやいや、そうじゃなくて。
つまりモータープールとは駐車場のことです。プールというのは溜めることを意味しますので、自動車を溜めておく場所がモータープールというわけです。

皆さんの身の回りでは、モータープールという一般的な言葉でしょうか?この言葉、大阪とその周辺でのみ使用される言葉であると聞いていたので、岡山県の倉敷で見かけた私は、「周辺」をやや広く解釈する必要に迫られたというわけです。

この言葉は「方言」として意識される機会は少ないと思います。
①和製英語であるため。方言とは「伝統的な」ものと捉える人が多い。
②大阪近辺の人も、駐車場のことをいちいちモータープールと呼ばない。
③使用圏外の人からは、一見して駐車場を意味していると理解されにくい。
といったあたりがその理由でしょうか。地域が限定されていることを考えると、十分方言と考えてよいと私は思いますが。

皆さんも、旅先で駐車場を見かけたら、モータープールと名前がついていないか、気にしてみると面白いのではないでしょうか。きっと、大阪文化圏みたいなものがうっすらと見えてきますよ。

#0309_子音と母音

一週間が水曜日から始まるのはかなーり気持ち悪いですね。初日なのに週の何日目なのか全然わかりません。



おすかーさんがブログでミキシングの話をしてましたが、私も最近、VOCALOIDの母音と子音の関係など思いを馳せつつ、ミキシングのことなどを考えることがあります。

言葉を喋らせるだけなら、いわゆる音圧(満遍なく大きな音が出ている感じ)を上げることは重要ではないですね。でも、BGMと合わせる場合には母音に対して相対的に音の小さい子音が聞こえにくくならないようなミキシングは必要でしょうし、アクセント(VOCALOIDエディタ上の強弱アクセント)を調整して母音と子音の音量のバランスを考えたいです。
でも、分かってるようで、意外と難しいですよね、VOCALOID2エンジン。

みたいな話をもうちょっと細かく書きたいんですけど、いかんせん時間がないです。本当はそういう感じの話をする生放送とかもやってみたいんですけどね。いかせん(ry

#0302_NHKェ

NHKが「浄化」を「効果」と同じアクセント(1型アクセント)で読むのが気になります。夜7時のニュースのアナウンサーがです。私は「降下」と同じアクセント(0型)の方しか聞いたことないんですが。
(※追記:よく考えたら「降下」もNHK的には1型でした。「効果」を「講師」、「降下」を「孔子」や「仔牛」に置き換えて読んでください)

こういう場合、大抵NHKの『日本語発音アクセント辞典』を開けば両方のアクセントが掲載されています。そして、アナウンサーが使っているアクセントが前に載っていて、アナウンサーが使わない方のアクセントは後に載っています。
なぜ一つの言葉に2つのアクセントがあるかと言えば、それは歴史的変遷の結果ですよね。前者がかつて主流だったが、現在では後者が主流になっているわけです。アクセント辞典編纂者はそれを分かった上で、まだ両者が並存している、つまり変遷の過渡期であると判断して両方掲載しているのでしょう。
伝統を重んじるNHKさんとしては、両者が混在している間は歴史的に古い方を模範とすべし、というスタンスなのでしょうが、もう少し言葉の変化の実態に機敏に対応する姿勢を示してもいいのではないかと、私なんかは思うわけですが。

#0025_ぶらっくろっくちゅーたー

大学時代1ミリも音響を勉強しなかった私が今更音響音声学に挑戦するよ
~第3回「/S/ が /tS/に聞こえるのはなぜか 前編」~


久々に挑戦するよ!
今回は音響音声学というよりは、VOCALOIDの仕様の確認のような話なんですけどね。
みなさん『ブラックロックシューター』という曲はご存知かと思います。

現在ニコニコ動画で6番目に再生数が多いVOCALOIDの曲です。ryoさんの代表作の1つですね。
さて、この曲、サビでまさしく「ブラックロックシューター」って歌うわけなんですが、ちゃんと聴くと「ブラックロック"チュ"ーター」と聞こえるかと思います。(『こっちむいて Baby/Yellow』のCDに収録されている最新の『ブラック★ロックシューター 2M MIX 』ではちゃんと直してありました)
これは何もこの曲に限った話ではなく、また初音ミクに限ったことでもなく、いろいろなVOCALOIDで見られます。「しゅ」が「ちゅ」に聞こえるのよりも、「し」が「ち」に聞こえる例の方が多いかな。最新のVOCALOID「VY1」でも試してみましたが、特に改善されている感じはしません。なぜこの現象が起こるんでしょうか?というのが今回のテーマです。
「とかちつくちて」なんてのもありますし、実際はVOCALOIDだけの問題じゃないんですけどね。
なお、ここでは、音声の表記はVOCALOID風の音声表記(X-SAMPAって言うらしい)で書きます。今回は/S/(英語のshの音)と/tS/(英語のchの音)だけですけどね。

まず、いきなり図です。
比較
これは、ミクに①「あーーーしゅーーー」②「あしゅーーー」③「しゅーーー」の3種類の発声をしてもらったものです。やってから「くしゅ」でやればよかったと後悔しました。まあいいや。
この3つの中では②が「あちゅーーー」に聞こえてしまいます。赤丸で囲んだ色の濃い部分が/S/の音の部分なんですが、②は直前の「しゅ」の前の「あ」の音に圧迫されて、十分/S/の音が出せていないんですね。これが/S/に聞こえない原因です。
試しに、①の音声を/S/の部分を除いて再生してみました。それが次の④です。
部分再生
こうすると、もうほとんど「ちゅーーー」のように聞こえます。でも「てゅーーー」が近いかな?
上図のように波形を直接操作しなくても、例えばVOCALOID Editorで「しゅ」の直前のDYN(音の強弱)を0にした場合も同じです。つまり下図のように。
直前のDYNを0に
実は、ピアノロールに音符が並んでいない部分でも音が出ていたんですね。逆に①のように、「あ」の音符が並んでる部分で「しゅ」の音が始まってたりもするわけです。この仕様は、直感的な使いやすさを重視して作られたVOCALOIDの、まさしく非直感的落とし穴と言えます。

じゃあ、VOCALOIDを使う人はどうやってコレに対処すればいいのかっていうと、トラックを分けたり、音のタイミングを変えたり、いろいろとやり方はあると思います。私はあんまり知りませんが、VOCALOID曲を作ってる人たちはいっぱいノウハウを蓄えてそう。

さて、ここまで見て、「しゅ」の音符を置いたはずなのに/S/に聞こえないケースがあるというのは分かりました。では、なんで/tS/の音に聞こえるのでしょうか?試しに自分の声を録音して、④と同じようなことをやったら、やはり/tS/のように聞こえました。VOCALOIDはこんな所まで人の声を再現していたのかっ!
実は、私も何でかよく分からないんですが、スペクトログラム分析とかすると分かるのかなーとか勝手に考えてます。要するにまだやってません。うまく調べられたら、また次回にでも。

テーマ:ボーカロイド - ジャンル:音楽

#0014_滑舌の悪い自分の声を資料にするのはどうなのか

大学時代、1ミリも音響の勉強をしなかった私がいまさら音響音声学に挑戦するよ
~第002回「喋る速さ」~

学生時代、音声学自体は必修だったので多少は勉強したんですけどね。ことさら「音響音声学」という分野を学ぶ機会はありませんでした。ほんと、ミクと出会ってなければ一生関係のない分野でした。
大学で言語学を専攻していたことが「喋らせてみた」を始めたきっかけの1つですが、逆に「喋らせてみた」が再び言語学を学ぶきっかけとなっているというのは大変面白いです。

今日は喋る時の「速度」というものをちょっとだけ考えてみます。「速度」と言ってもbpm的な話ではなく、個々の音(拍、モーラ)の長さのことです。
私の初期設定vsqファイル
これは私がいつも使っている初期状態のvsqファイルです。ここにセリフを流し込むところから、喋らせの作業が始まります。
完全に等間隔に無音の音符が並んでいます。日本語は1拍1拍(モーラ)の長さが等間隔であるというのが、一応のタテマエですが、現実の発話はそんなに単調ではありません。私も最初のうちは、完全に等速でミクに喋らせていたわけですが、今聞き返すと、なんといいますか、非常にダイナミズムに欠ける喋り方です。

では、実際にはどうなっているのでしょう?試しに自分の声を録音して、それぞれの音(拍、モーラ)がどれくらいの長さになっているか調べてみました。
サンプル「こちらこそ」
「こちらこそ」という短いセリフです。若干ネタバレです。
チマチマとカーソルを当てながら、部分部分を切り取って再生しつつ、どこで拍の区切れがあるかを調べます。結構面倒です。
結果を見てみますと、だいぶ長さが違います。「ち」が短いのと、末尾の「そ」が長いのが特徴ですかね。「ち」と「そ」を比較すると長さが2倍くらい違うという。
「よし、じゃあ、これをそのままvsqに当てはめるぞ」ってやると、それはそれで苦戦しそうですが、こんな感じで先に分析をして、拍の長さの特徴を掴んでから始めると、自然な喋らせになるかもしれません。面倒くさいんで、私はめったにやらないつもりですけどね!

#0007_センセー、なんで母音が母で、子音が子なんですか?

「大学時代、1ミリも音響の勉強をしなかった私がいまさら音響音声学に挑戦するよ」
第001回「子音の長さ」。

もうすぐ「喋らせてみた」を始めて4ヶ月ですが、始めた当初から、「実際に人間がどのように言葉を話し、どのように言葉を聞いているかについて考えるのって、きっと「喋らせてみた」の役に立つよね!」というのが私の考えです。
でも別に日本語の話し方って学校で教わるものじゃなくて、自然と勝手に覚えるものだから(日本人にとっては)、自分がどういう仕組みで言葉を話しているのかってよく分かりませんよね。それじゃいろいろ調べてみよう!という企画です。
一応言語学の学生だったんですけどね。ロクに大学に通わず、毎日オンラインゲームばかりやってました…。
まぁ、素人ですから、あんまり難しいこと考えず、分かる範囲でやっていきましょう。

今日はミクでボカロの子音の聞き取りづらさにについて考えてみました。
といっても、ミクの声をwaveファイルに書き出して波形を観察するだけですが。
さっそくこんな感じのvsqファイルを用意して…
かかか_120bpm_8分の1拍子
できたwaveファイルを適当な波形編集できるソフトに。私の場合Audacityです。
比較のために生身の人間(自分)の声でも並べてます。自分だけだとイマイチなので、今日は声優の沢城みゆきさんの声も使ってみることにしました。
音源はこちら

「蚊もお前の血は吸いたくないってさー」の最初の「カ」です。すごいセリフですね(´▽`)

みゆきち「蚊もお前の血だけは吸いたくないってさー」
3人分並べた結果がこれです。波形の先頭の青が濃い部分が子音(ここでは[k]の音)です。3者ともだいぶ違いますが、ミクの、特に2回目の子音の弱さが際立ちますね。

そんなわけで、耳で聞いただけじゃよく分からないボカロの子音の弱さを可視化できましたという話でした。
では、子音が弱いのは分かったけど、じゃあどうするのって聞かれると、私はあんまり良い答えを持ってません。ダメジャーン。
今度YAMAHA自身が新しく出すボカロは、子音もはっきりとしているらしいという噂なので、この辺が良くなってるといいですね。

そんなわけで第1回目の「大学時代(以下略」でした。
かなり適当な分析でしたが、やってから考え直してみると、子音の長さが短いと子音の聞こえが悪くなるのか(スペクトログラム分析しなくていいのか)、とか、[k]の音だけ見て子音全般について語っていいのか、とか、ミクを使っただけでボカロ一般について論じていいのか、とか、言い出したらきりが無いです。
まぁ、次回以降、もうちょっとマシな分析になるようにぼちぼちがんばっていこうと思います。ではでは。

前頁 / 翌日  | ホーム |  前日 / 次頁

お知らせ

2013/01/19:第10回MMD杯予選動画を投稿しました

プロフィール

なまえ:すぺくたくら
初音ミクに言葉を教えています。
あとMMDも。あとメガネ。
>> マイリスト  >> 自己紹介
メール:spectacler(あっとま)gmail.com

ミクさんから一言

twitter

カウンター

相互リンク

カレンダー

05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -

動画

静画

最新コメント

最新記事

月別アーカイブ

カテゴリ

動画製作 (200)
言葉の話、音声の話 (11)
喋らせてみた (105)
メタセコイアでメガネを作ろう (39)
その他 (369)
MMD (217)
月間MVV(最優秀動画賞) (15)
初回 (1)
音声編集 (4)
ニコ生 (31)
プログラミング (19)
メタセコイア (12)

リンク

このブログをリンクに追加する

最新トラックバック

検索エンジン向けキーワード

Vocaloid/初音ミク/喋らせてみた/トークロイド/ニコニコ動画/MikuMikuDance/MikuMikuTalk/みくみくトーク/みくみくとーく/ミクミクトーク/ダウンロード/DL

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。