【簡単】UTAU音源を自作しよう!【解説】

 

 

この記事は、目黒ワンニャンパーク Advent Calendar 2021 - Adventarの記事です。

 

 

自己紹介

f:id:fQCHAN:20211219151515p:plain

みなさんはじめまして、きゅうです。

普段はなかひこくんさんと他98人の仲間たちというdiscordのサーバーで原神とか麻雀で遊んだり、趣味で歌ってみた動画(Q channel - YouTube)を投稿したりしています。(よかったら見てね)

 

前置き

突然ですがみなさんはUTAUをご存知ですか?正式名称は「歌声合成ツールUTAU」といい、フリーの歌声合成ソフトです。ボーカロイドと同じように歌詞と音程を入力すれば自由に歌わせることができますが、UTAUの最大の特徴は、歌わせる「声」を自由に変えられることで、インターネット上には様々なキャラクターと音源が存在しています。

 

 

 

 

 

まあそんなことはいいからさ・・・

 

 

 

 

 

 

 

 

f:id:fQCHAN:20211219161831j:plain

 

ということでUTAU音源の作り方を調べて作ってみたので、自分用のメモがてらこの記事で紹介していこうと思います。

 

長くなってしまったので、結果だけ知りたい人は歌わせてみましたまで飛んでください。

用意するもの

  • パソコン(そこまで重たいソフトは使わないので、ノートパソコンでも大丈夫)
  • マイク
  • ヘッドホン
  • UTAU(最終的に作った音源をここで歌わせます)
  • OREMO(UTAU用の音声ライブラリ録音に特化したソフトです)
  • setparam(録音した音声をUTAUで編集しやすいように加工するソフトです)
  • 録音リスト
  • ガイドBGM

録音

まず、どのような音源方式で録音するか決めます、音源方式には単独音、連続音、CVCCが主にあります。

 

単独音...音の繋ぎは連続音よりも劣るけど録音、原音設定が楽。「あ」「い」という風に一音ずつ録音する形式。
連続音...音の繋ぎは三種類の中で最も良いが録音、原音設定はそこそこ気力が必要。「_ああいあう」などのかたまりで録音する形式。
CVVC...音の繋ぎは単独音より良いくらい。録音は楽だが原音設定はこの中で一番疲れる。「_ああいあう」などのかたまりで録音する形式。

 

http://vocane.omaww.net/blog/utau/20170213

 

単独音だとちょっと物足りないかな、と思ったので私は連続音で録音することにしました。どのように録音するか決めたら録音リストをダウンロードします。私は飴屋製連続音リストを使いました。

 

ダウンロードした録音リストはOREMOのファイルにそのまま入れます。ではOREMOを開いてみましょう!

 

f:id:fQCHAN:20211219191647p:plain



開いたらこんな画面が出てくるはずなので、ファイル→音名リストの読み込みからOREMOのファイルにぶち込んだ録音リストを読み込みます。

 

f:id:fQCHAN:20211219192151p:plain

 

読み込まれました!すごい!

録音リストを読み込むことができたら実際に録音していきます。

 

オプションの収録方法の設定から自動録音その1を選択します。

 

f:id:fQCHAN:20211219193003p:plain


自動録音を選ぶことで録音するときにガイドBGMが流れるのですが、ガイドBGMに合わせて録音することで全ての音の感覚が均等になり、後の作業が楽になります。

ガイドBGMは自分の使う録音リストの音数に合わせて選びましょう!私はちえP製 ガイドBGM「One Note Jazz」のBPM100の音程Fを使用しました。視聴してみて自分が歌いやすいものを選べば大丈夫だと思います。ダウンロードしたガイドBGMはOREMOのファイルのguideBGMというファイルに入れれば使うことができます。

 

ファイル→保存フォルダの変更から、自分がわかりやすいファイルを選択したら録音開始です!

OREMOで録音に使うキーは主に

R:録音
5:再生

上下キー:前後録音へ移動

くらいしかないのでとてもわかりやすいと思います。

録音中にノイズが入ったり、音を間違えたりしてしまった場合はもう一度Rを押すと同じ音を録音し直すことができます。

録音は一音ごとに自動で保存されていくので、録音を中断する場合は☒を押してOREMOを閉じても大丈夫です。録音が終わったらメニューバーからoto.ini生成→連続音を選びます。

 

f:id:fQCHAN:20211219194833p:plain

 

そうするとこのようなウィンドウがでてくるので、自分の使用したガイドBGMと同じBPMを入力します、発声開始位置はガイドBGMの中に添付されているドキュメントファイルに作者が表記してくれていると思うのでそれを参考にしてください。

入力できたら収録テンポから各パラメーター値を初期化というボタンを押し、パラメーター生成をしてください。これで録音は終了です。

 

原音設定

原音設定とは録音したwavファイルをそのままUTAUで合成すると、音が歪んでしまったり発声タイミングがずれてしまうためそれを調整する作業です。また、連続音の録音ファイルの場合には録音した文字を分解し、「母音+文字」にする作業も含まれます。

 

この作業ではsetparamを使います。

setparamを開くと保存フォルダの選択を求められるので、さっき保存した原音パラメータファイル(oto.ini)が含まれるフォルダを選択し、原音パラメータファイルを読み込みます。

 

このような画面が出たら成功です!

f:id:fQCHAN:20211219210704p:plain


音声の波形が読み込めたら、上のメニューバーからツール→原音パラメータの自動推定→連続音の自動推定を選択します。

f:id:fQCHAN:20211219212219p:plain

このような数値が出てくるのでOREMOで設定したのと同じように収録テンポと発声開始位置を設定しパラメータ生成します。

すると自動で大体の音の設定をしてくれるので、ずれた部分を手動で設定していきます。

 

手動で設定する前にオプションからマウスキー操作の設定を下の画像のようにすると設定しやすいです。

f:id:fQCHAN:20211219214832p:plain

f:id:fQCHAN:20211219214840p:plain

 

では原音設定の用語の解説をしていきます。

 

f:id:fQCHAN:20211219213230p:plain



左ブランク:音の始まる位置。

オーバーラップ:前の音とどれだけ重なるかの位置。「母音+子音」の母音の部分に当たります、だいたい左ブランクと先行発声の間くらいの位置に置いています。ただし子音単体の音のときは左ブランクのすぐ隣くらいに置くといい感じになります。

先行発声:発声タイミングの位置、母音と子音の間のくびれた部分に置いています。

子音部:発声タイミングの位置。音を伸ばしたときに伸びる部分。先行発声と右ブランクの間くらいに置いています。

右ブランク:音の終わりの位置

 

自動推定した音に正しく音が推定されているか確認をし、明らかに間違っている部分は手動で直していきます。(マウスで位置を調整することができます)

全ての音の原音設定ができたら名前を付けて保存します。(OREMOと違って自動で保存されないので注意!)

 

では実際歌わせて見ましょう!

 

UTAUの設定をしよう

ではいざ、UTAUを起動しましょう!

f:id:fQCHAN:20211219222016p:plain

最初はデフォルトの音声が入っているので、デフォルトと書いてある部分を左クリックして

f:id:fQCHAN:20211219222111p:plain

原音ファイルセットから、原音設定をしたoto.iniファイルを読み込みます。デフォルトの部分が自分の用意したファイル名になっていたら成功です。後は好きに歌わせまくりましょう!(UTAUの使い方は私もよくわかってないので省略します)

 

歌わせてみました

youtu.be

時間がなくて一部しか調声できなかったので、いつかしっかりしたUTAUカバーの動画を作りたいです。

 

あまりにも尺が短いので単独音で作った音源で歌わせたうっせぇわも載せておきます。

 

youtu.be

 

まとめ

自作UTAUは無事に完成しましたが、思っていたより自分の声らしさが感じられずにがっかりしました。私と話したことがある人が聞いたら私の声だってわかるのかな?よかったら教えて下さい。

 

読み返してみるとかなり長くなってしまいましたが、UTAUに興味を持ってくれる仲間が一人でもできたら嬉しいです。私ももっと勉強したい・・・。

目黒ワンニャンパーク Advent Calendar 2021 - Adventarはクリスマスまで続くみたいなのでみなさんの記事を楽しみにしています!