チノちゃんに「お兄ちゃん」って言わせたい!

やっつけで作ってしまった…… pic.twitter.com/tWRmXDXemD

— イショティハドゥス (@Ishotihadus) 2015, 11月 21

このツイートがかなりの反響を呼んだ。もとのセリフは「ごめんねお姉ちゃん、いい子になるからもう怒らないで」。これを「お兄ちゃん」にしたわけだ。

今まではコラ画像の時代だったが、これからはコラ音声の時代。その手始めに、これの作り方をメモっておくことにした 。

〜追記〜

twitterアカウントが凍結されてしまったので、YouTubeに良質なものをあげてみました。

素材の選び方だが、「エロゲの音声をとってきた」などのツイートも見られたが、実際にはそう簡単にはいかない。人間の耳は結構いい。

一番問題なのは、「酔っているチノちゃんの声を当てた時の水瀬いのりの声」が必要だということである。魔法少女チノのドラマCDも探したのだが、マシな「にい」の音が見つからなかった。目覚ましアプリだと「お兄ちゃん」とはっきり言うのだが、結構急ぎ気味に言っていること、素面であることからちょっと厳しそうだった(実際やってみるとうまくいくかもしれないが……)。

酔っている場面ではほぼBGMが鳴っているので、結局子音のnは諦めて、音声中にある「いい子になるから」の「いい」を使うことにした。

なおコラ音声にはほぼAdobe Audition、iZotope RX、Audio Directorなどが必須である(AudioDirectorは微妙そう?)。スペクトルが生編集できるソフトウェアをこれ以外に知らない。知ってたら教えて。今回はAdobe Auditionを用いている。iZotopeは買うお金なし。

最初の波形はこんな感じ。「おねえ」の部分だけ。。少し強い部分→弱い部分→かなり強い部分になっているが、これがそれぞれ「o」「n」「e」にあたる。

最後の減衰も含めて「いい」を入れたいので、こんな感じにコピー。

ピッチも長さもむちゃくちゃなので、とりあえず長さを整える。コピー前の「ええ」は0.270秒、コピー後の「いい」は0.255秒なので、0.270秒になるようにストレッチする。ここではピッチの上下が動かないようにする(リサンプルでない)。さらにスプライシングの周波数を声が綺麗になるように調整する。

次にピッチの調整。チノちゃんがどんなふうに「おにいちゃん」と発音するのかを妄想しながら調整する。ところがどっこい単純に「い」の音がそのまま出るわけではないので注意しながら調整。

とりあえずはこんな感じ。-2.4半音くらい落とした気がする。

次に接続部分の違和感を消すために修正ツールでスペクトルをガバッと修正。

さらに「フォルマント周波数」を意識しながら「い」の音を調整する。ここでやっとちゃんとした母音になる。耳がよければ耳がフーリエ変換してここのピッチを落とすと「い」になるっぽいとかすぐわかるはずなので難しくない。

こんな感じ。微妙に真ん中辺りのスペクトルを弱くしているのがわかる。ブラシツールで書いてからDeleteするとだいたいできる。不透明度とサイズを調整しつつやるとよい。

最後にピッチベンドをかける。「おにいちゃん」のときに「いい」がそのまま伸びるのはおかしくて微妙にピッチが下がったほうが良い。1〜2半音くらい下げておく。最後に綺麗に整えてあげて、最終的には下のような感じ。

結局は、元の素材をコピペして、おかしなところをブラシで修正する、というコラ画像の作り方とほぼ同じ。

みんなも音声言語処理を勉強して最高のコラ音声を作ろう!

【限定タイムセール】【マフラー】※送料無料※FREEDOM PERFORMANCE exhaust インディペンデンスショート ダイナ用:2006年以降に適合(クローム) ハーレーパーツ YAMAMOTO 2017 G144-65-001

Q. 他にもSpectraLayersがありますよ?こちらの方が使いやすいかも

知りませんでした。今度使ってみます。

Q. Melodyneで全部調整できるのでは?

Melodyneは持ってません(パンチの絵文字)。Melodyneの実力は知らないので何とも言えませんが、手持ちのVariAudioだとなかなか成果が得られなかったのでそんなものなのかな…とか思ってたりします。今度やってみます。。

Q. 最初のストレッチの作業は必要なかったのでは?

動画と合わせたかったからストレッチしました。あとは「おにいちゃん」をするっと言った時の長さも多分そっちの方が自然なのでは。よく検証してないけど。

Q. 背景BGMを消せたらもっと素材が増えたのでは?

背景BGMを消すのはそんなに簡単ではないと思っています。もちろんそれなりの精度ではできますし、CDがあればなお、ですが、やはりそれでも「それだけ」の声には敵わないでしょう。

Q. 耳がフーリエ変換とは?

耳は構造的にスペクトル分解をしています。実際にスペクトログラムをたくさん見てきたり、スペクトルの姿をたくさん見てくれば、脳内フーリエ変換・耳でフーリエ変換して脳内フィルタをかけることはそれなりにできると思います。もちろん実際にやってみてそこからまた調整して、を繰り返す必要はありますが。

そのほか

「このピッチを落とすと『い』になるっぽい」ですが、正確には「この辺のピッチのにょろにょろの振幅を落とすと」みたいな表現です。誤解を招きそうなので書いておきます。

カルラボさん(via ニコニコニュース)、Gigazineさんに掲載していただきました。ありがとうございます。

一応音声のm4aファイルを置いておきますので、目覚ましや知り合いの自称お兄ちゃんを励ます際などにお使いください(ノーマライズなどは各自でお願いします) → これ


【マフラー】※送料無料※FREEDOM PERFORMANCE exhaust インディペンデンスショート ダイナ用:2006年以降に適合(クローム) ハーレーパーツ YAMAMOTO 2017 G144-65-001超低価セール

  1. ピンバック: チノちゃんに「お兄ちゃん」って言わせたい! | 愛のらくがき帳 #テクノロジー -|アニメアンテナ「Anitenna」

  2. あのに

    あんまりこの手の波形編集ソフトは詳しくないのですが
    ・SpectraLayersPro
    はどうでしょう?

    返信
  3. ピンバック: ツカエル!ネットの話題 » Blog Archive » 11月24日 05:00版

  4. ピンバック: 2015-11-24のニュース | Re: spam news

コメントを残す コメントをキャンセル

メールアドレスが公開されることはありません。。

。 * が付いている欄は必須項目です