Frequency-domain Singing Articulation Splicing and Shaping.
YAMAHAのVocaloidで採用されているとされる独自技術。
ボーカロイド公式サイト(http://www.vocaloid.com/lineup/vocaloid1/)によれば、
データベース作成時
- 実際の人間の歌声から
- 歌唱に必要な歌唱アーティキュレーション(SingingArticulation=音節などの音の断片やビブラートなど、あらかじめ定めた"声の表情"のコレクション)を集め
- 周波数領域への変換処理を行ってからデータベース化、
実行時
- 入力された歌詞に合わせ、歌声の断片から構成されたデータを取り出し
- ピッチ変換や歌詞としての接続
- 周波数領域でスムージング
といったことを行っているという。
参考
その実なんだかよくわからない。
英語日本語並べてみると基本的にサンプリングして複数のサンプルを時系列で並べて間をフォルマントが破綻しないように補完するということに見えるのでIL Morphineっぽい感じかなとは思うし、Morphineとは「時系列で補完する仕方」もサンプルから持ってきていそうななあたりが違うんじゃないかとかも思う(とはいえそのあたりが具体的に何かというのが問題ではある。今時の個人やコミュニティが持つ計算資源からすると、そこが特定できると独自技術足り得ないのかもとも思う)。