国産の「歌声合成ツール」。
Windows用。
厳密な区別は不明だが(というか未定のような気がするが)Macへの移植版はUTAUではなく「UTAU synth」と呼ばれている。
要は「ボーカロイドのようなソフト」で「ピアノロールで音を並べてそこに平仮名で歌詞を書くとそのように歌ってくれる」ものと考えてよい。と思う。
歌声は大雑把に言えば
という仕組み。「Audacityを使って手動でやってたのを自動化するためにできた」ソフトとかいう話らしい。
「音程の上げ下げ」、「縮めたり伸ばしたり」の部分は(前提となる元音声のfundamentalの抽出やらharmonicsの推定をしたり、子音部分を抽出して最低再生時間の保証したり、母音部分を抽出して元の音の意図しない音程変化を潰したりループないし伸張可能な部分を探したり、フォルマントのホウラク線を抽出してピッチ変更対象から外したり…をやってると思うが想像)けっこう大変な高等数学が必要となる話で、それを司るのがresampler.exeというコマンドラインツール。UTAUと呼ばれるプログラムはピアノロールを中心としたGUIツールだけど中ではresampler.exeを呼び出してるというか呼び出すためのwindowsバッチファイルを生成して呼び出すということをやってるらしくてUTAU実行時にも(作者の趣味なのか)「黒い画面」上でその様子を目で見ることができるようになっている。
原則的に「五十音を前提としている」にも関わらず、非日本語圏でも結構使われてるらしい。何と言うか「プリミティブな仕組みである」のも影響してるんじゃないかと思う。言語が持つ母音の数とかがシステムの根幹に関わらないからとかそんな。
ひたすらWAVファイル加工する仕組みなので、50音の音声WAVファイルを用意すればその声で歌うようにできるのが特徴。多分ピアノロール上の文字とファイル名のマッチングさえできてればいいはずなので、ピアノロールで使わないなら50音揃える必要もないし、人間の声である必要もないし、そもそもデフォルトで提供される音声はAquesTalkによる合成音声。
最近はもうちょっと複雑なことをやってるらしいけどその辺は知らない。