FL Studioの音源「Harmor」のドキュメント(英語版ヘルプ http://www.image-line.com/support/FLHelp/html/plugins/Harmor.htm#harmor_img )の「IMG - Image Synthesis / Resynthesis」の翻訳(部分)。
----
IMG - 画像シンセシス/リシンセシス
----
IMGセクションでは、「画像のロード」''もしくは''「サンプルのロード」を行うことができます。
#contents
**画像シンセシスとリシンセシス
|「リシンセシス」モード|「リシンセシス」モードで編集処理は、サンプルデータのオリジナルファイルを参照して行なわれます。つまりHarmor側で行なう設定は「編集のたびに元データを再アナライズして生成したデータに対する操作」として定義されます。これにより、「周波数」と「ゲイン」の情報に関しては、理論上最高のディテールでを扱うことができます。確認ですが、Harmorの加算合成エンジンは、音声情報を瞬間瞬間で刻々と変化する「周波数スペクトルのエンベロープ」と「音量」のデータの組として扱っています。&br;(訳注:訳の表現がすごい微妙な感じになってるんですが、ここでいうエンベロープというのは、たぶん「楽器音はホワイトノイズとかじゃないのでサンプル音のスペクトルは普通「への字」じゃなく「山の字」みたいに不連続になる」。という前提の上で、「にも関わらずその不連続なスペクトルを、数学によって「への字」=「連続的な周波数の変化」として解釈した、フォルマントのエンベロープとして再構成している、という前提で動いていることを忘れないでね」、的な意味で言ってるんじゃないかと思います)&br;(訳注:あと、当然ですが、「参照」なので「パッチ再配布」とか「オリジナルデータの移動、変更」などには注意する必要があります)|
|「画像シンセシス」モード|「画像シンセシス」モードでは、サンプルデータは二次元の画像データとしてHarmorの中にコピーが作られ、それを編集します。こうして生成した画像は、通常の画像ファイルと同様、画像処理ソフトで扱うことができます。&br;Harmorでは、「ゲイン」と「ピッチ」は独立したプレーン(訳注:実際のところHarmorが扱うのは画像をRGB分解したGとBのプレーンと考えていいみたいです)として扱わます。&br;Harmorではあらゆる画像データが利用できます。音声合成用に使われる想定でない画像データであっても、恐らくは「何がしかのおもしろい音」になるでしょう。|
簡単にまとめると、
-リシンセシス=品質優先
-画像シンセシス=編集しやすさ優先
と言ってもよいでしょう。
''ヒント:''
「リシンセシス」モードと「画像シンセシス」モードの違いで重要なのは、partialの位相(phase)の扱いです。リシセンシスモードではオリジナルの音声データの位相がそのまま使われるのに対し、画像シンセシスモードでは「Harmonic phase」マッピングで指定された固定値が使用されます。
これは、''リシンセシスモードの方が編集時に劣化しにくく自然な音に聞こえる''ということを意味しています。
''ヒント:''
リシンセスモードから画像シンセシスモードへの変更はできます(Image optionsメニューから行えます)が、いったん画像シンセシスモードに変更するとリシンセシスモードに戻すことはできません。変更すると、元の音声データへのリンクは切断され、以後は画像に変換された音声データのコピーを編集することになります。
**''Harmorに最適な画像データ''
Harmorは516のpartialを扱うことができます。このため、高さが516ピクセルの画像データでは、516のpartialすべてを扱うことができます。ピクセルの「明るさ」はpartialの振幅として扱われます。
黒のピクセルはpartialがないことを、白のピクセルは振幅が100%のpartialを意味します。
「高さ516ピクセルで一番下に1ピクセル幅の白い線がある画像」は、第一partialだけが鳴る(訳注:つまり叩いたノートの周波数のサイン波)ことを意味し、「高さ516ピクセルで一番上に1ピクセル幅の白い線がある画像」は第516番目のpartialだけが鳴ることを意味します(訳注:Harmorのブラウンノイズのウェイトとか17kHzカリングとかいろいろな都合で音として聞こえない場合やそもそも合成されないケースが多い気はします)。
「時間」は画像の幅として表現されます(後述しますが、時間方向の拡大率は調整できます)。
高さが516ピクセル以下の画像では、第一partialが画像の一番下のピクセルとなります。高さが20ピクセルの画像では最初の20個のpartialだけが演奏されます。
**IMGタブのコントロール
''「スクラブ」操作''
画像エディタ上で左または右クリックしドラッグ操作すると音声の「スクラブ(訳注:scrubとは、DJがビニールレコードのターンテーブルを直接手で回してギュコギュコやるやつです。たぶん)」操作となります。
FL Studioを録音状態にしてスクラブすれば、この操作をレコードできます(レコードできるのはFL Studio10.0.5以降を使用している場合に限ります。それ以外の環境では、VSTiプラグインの仕様の制約があるため不可能です。FL Studio用Harmorでは、独自拡張でこの制約を回避しています)。。
画像エディタ上で右クリックして、上下でピッチ、左右で時間を操作します。speedツマミはあらかじめ0%に設定してください。
**IMGのUI:''Image optionsメニュー''
|>|BGCOLOR(#cccccc):Tools|
|Clear all|画像やスペクトルの全プレーンを消去します。|
|Prepare time envelope|「ENV > Image time offset > Envelope」を初期状態にして開きます。これは「スクラッチ」や「タイムワープ」を定義するためのエンベロープです。|
|Create bouncing loop time envelope|サンプルに設定されたループポイントを元に、「ENV > Image time offset > Envelope」を開きます。|
|Slow down within loop region|Slows down the speed within the set loop.|
|Tune pitch for time offset|Changes ENV > Pitch > Envelope as a function of start time.|
|Set viewed zone as loop region|Sets the section visible in the window as the Loop Region.|
|Set last played zone as loop region|Sets the last section played as the Loop Region|
|Map time offset to last hit key|Sets the ENV > Image time offset > Keyboard mapping so the last key played. To use set the time to the desired part of the image and play a key and use the function. This way you can build up a unique set of MIDI keys to playback (time) positions.|
|>|BGCOLOR(#cccccc):Audio|
|Analyze audio file|ファイルブラウザを開き、音声ファイル(.wav, .mp3, .ogg)をHarmorにロードします。|
|Convert to image synthesis mode|Harmorを「リシンセシス」モードから「画像シンセシス」モードに変更します。&br;Harmorには「リシンセシス」モードと「画像シンセシス」モードという、2つのモードがあります。サンプルがドロップされた団塊ではHarmorha「リシンセシス」モードとなります。リシンセシスモードは元の音声ファイルを「参照」として扱うため音質の劣化は最小限です。「画像シンセシス」モードに変換すると編集の自由度があがりますが、音質は犠牲になります。編集自由度と音質のトレードオフです。トレードオフはお嫌いです?|
|Map audio markers to keys|Samples with embedded time markers will be mapped to keys using the 「ENV > Image time offset > Keyboard mapping」 envelope. Useful for creating 'slicing/stuttering' effects in Harmor. NOTE: Playback will continue to the end of the sample starting from each marker triggered if a key is held. To confine playback to the marker regions use the next option:|
|Map audio regions to keys|Similar to 'Map audio markers to keys' except playback is limited to the regions defined by markers in the audio file. NOTE: For 'play to end' of the sample type behavior use the previous option.|
|>|BGCOLOR(#cccccc):Image|
|Generate random cloud|ランダムな「雲っぽい画像」を自動生成します。|
|Degrade horizontally|画像を横方向に圧縮します(訳注:どういう潰し方をしてるのかはまだよくわかりません)。|
|Degrade vertically|画像を縦方向に圧縮します。|
|Crossfade 10%, 25%, 50%|画像全体に対し、指定した割合でクロスフェード部を作ります。|
|>|BGCOLOR(#cccccc):Selected image plane|
|Open image file|Opens a file browser to load an image file (.bmp, .jpg, .png, .gif). The image is embedded in the patch, not linked to.|
|Save as image file|Saves the current image.|
|Edit image|Opens the default Image Editor on your PC.|
|Copy to image clipboard|Copies the current image to the clipboard.|
|Paste from image clipboard|Pastes the current image from the clipboard.|
|Clear|Clears the image.|
|Invert|Inverts the image polarity (creating a negative) so light areas become dark and dark light.|
|Flip vertically|Flips the image so the top becomes bottom and vice versa.|
**IMGのUI:IMGセクションのコントロール
|Planeドロップリスト|image windowに表示する画像のプレーンを選択します。「Frequency(周波数)」、「Amplitude(ゲイン)」、「Combined (All) (両方)」が選択できます(訳注:画像的に言えばそれぞれ「RGBのG」と「RGBのB」「RGBのBとG」と同義です。Harmorでは、Rは多分「音のデータ」としては使っていません)。|
|Copy/Paseボタン|image window上の画像を、OSのクリップボードとの間でコピー/ペーストします。これらのボタンは「Image options」メニューの「Convert to image synthesis mode」コマンドを実行するなどして「画像シンセシスモード」になっていないと使用できません。|
|Oct/Hzトグル|縦方向のスケールを指定します(訳注:スケールとかいろんな文脈であちこちに出て来るような気もしますがこの場合「目盛りの振り方」と思ったらいいかも知れません。目盛りは出ませんが。)|
|>|BGCOLOR(#ff66ff):時間(画像でいう横方向)関係のセクション|
|C (course speed)ツマミ|再生速度を調整します。|
|F (fine speed)ツマミ|再生速度を微調整します。|
|sharpツマミ|Image sharpening. Sharper images will have shaper transients. Left is transient sharpening, right is transient sharpening + phasing.|
|>|BGCOLOR(#ff66ff):ループ指定とループのモード|
|>|ループ範囲は、「image window上でCTRL+左クリックしてループ範囲をドラッグ」して指定します。ループ再生開始ポイントはLoop Startとして設定したポイントと同一ですが、このポイントは「Image time offsetツマミ」で動かすことができます。&br;ループの設定は「Image optionsメニュー > Tools」から「Set viewed zone as loop region(訳注:「今見てる範囲」をループ化する)」や「Set last played zone as loop region(訳注:「今再生した範囲」をループ化する)」などのコマンドでも行えます。&br;また、読み込んだサンプルにあらかじめループが定義されていた場合、Harmorはこれを自動判別し、Harmor上でもループが設定された状態で読み込みます(訳注:音声ファイルにループを設定するのは、FL StudioではEdison等のツールで行えます)。|
|>|BGCOLOR(#ff66ff):looping(ドロップリスト)|
|One shot|一回だけ再生されます。|
|Loop|2つのループポイントの間をループ再生します。再生ポイントが終端に着くと、先頭に戻って何度も走査されます。|
|Ping pong|2つのループポイントの間を「行ったり来たり」する形でループ再生します。ping pongとは終端に着くと逆再生して、先頭まで戻ったら順再生するモードです。|
|>|BGCOLOR(#ff66ff):|
|smoothツマミ|Image time offset smoothing sets the time taken to relocate between Image Time Offset positions. The smoothing knob has different behaviors when turned left and right of 12 O'Clock. Left (Always): Smoothing is applied according to the time-constant set, Right (With threshold): Smoothing is only applied for small distances, when the offset is moved over large distances smoothing is ignored. This is useful to smooth out small movements but allows larger 'quick' jumps.|
|TIMEツマミ|画像を走査して音声再生する際のスタートポイント'start time offset'を調整します。画像を見ながら調整すると良いでしょう(訳注:TIMEツマミの値は画像上では「紫の縦線」として表示されます)。|
|>|BGCOLOR(#66ffff):LEVEL Section|
|>|これらのコントロールは、画像のや元音声の情報から「音量」へのマッピングを調整します。画像やスペクトルで言えば「ピクセルの明るさ」に相当します。The frequency image plane at 50% grey = 1, no change to the original level.|
|>|BGCOLOR(#66ffff):Image gain (ドロップリスト)|
|>|ピクセルをゲインレベルにマッピングする際の補間アルゴリズムを指定します。各補間アルゴリズムの意味は、Harmorのプリセット「Tutorials and tricks > Image synthesis > Interpolation」を見ると参考になるでしょう。|
|>|BGCOLOR(#66ffff):Choose from:|
|Block, Cap Bell|様々な補間アルゴリズムです。耳で判断しましょう。|
|Linear, Cubic|様々な補間アルゴリズムです。耳で判断しましょう。|
|Rise, Fall|特殊な補間アルゴリズムです。levelの上昇(rising)と下降(falling)のみを行います(訳注:意味がわかりません。が、上記チュートリアルを見るとわかるのかも知れません。わからないかも知れません。補間=interpolationという言葉の意味がしっかりわかると、考えるまでもないのかも知れません)。|
|>|BGCOLOR(#66ffff):|
|Image gain pixel scaleツマミ|Image brightness to gain scaling.|
|Image gain mixツマミ|There are separate gain and frequency image planes. This knob blends in the gain information. When set to 0%, all active frequencies active are equally loud.|
|>|BGCOLOR(#ffcc66):FREQ section|
|>|これらのコントロールは、画像のや元音声の情報から「周波数」へのマッピングを調整します。画像やスペクトルで言えば「縦方向のスケーリング」に相当します。|
|>|BGCOLOR(#ffcc66):Image frequency interpolation curve (ドロップリストその1) - Choose from:|
|Block, Cap Bell|様々な補間アルゴリズムです。耳で判断しましょう。|
|Linear, Cubic|様々な補間アルゴリズムです。耳で判断しましょう。|
|Rise, Fall|特殊な補間アルゴリズムです。levelのrisingとfallingのみを行います(訳注:意味がわかりません。が、このあたりの選択肢は、サンプリング音ではなく8x8ドットの絵とかで試すと違いがわかるような気がします。FLのブラウザに"Harmor/Data/Images/Calibration - interpolation check"というそれっぽい画像ファイルがあります。)|
|>|BGCOLOR(#ffcc66):Image frequency mode (ドロップリストその2) - Choose from:|
|Octave, Hz, Wide Hz|縦方向のピクセル位置と周波数の関係。Hzモードはハーモニクスを平坦化して表示します。(訳注:元画像を、Octaveモードでは1倍音2倍音4倍音8倍音が均等であるように扱い、Hzモードでは1倍音2倍音3倍音4倍音が均等であるように扱うんじゃないかと思います。Wide Hzはよくわかりません。)|
|Unison|画像をUnisonのデチューニングとして扱います(訳注:意味がよくわかりませんが、音的には音程の情報が失われるようで話し言葉なら「抑揚のないしゃべり方」になるようです。原文はLevelじゃなくFREQな気はします)。|
|>|BGCOLOR(#ffcc66):|
|SCALEツマミ|「Image frequency pixel scale」は画像シンセシス・リシンセシスでの周波数オフセット量をコントロールするツマミです。制御は「(右クリックメニューの'edit articulator'で編集できる)独自のエンベロープ」と、上で既に説明した「Interpolation」、「Mode」コントロールに基づいて行なわれます。By default turning this to zero will rescale lower frequencies toward the fundamental harmonic relationship with decreasing scaling applied as a function of increasing frequency.|
|FORMツマミ|フォルマントの移動を行ないます。&br;フォルマントとは、人間の発声器官、ピアノ、ギターなどの形状やサイズに由来する、周波数のピーク(レゾナンス)の特性です。フォルマントを維持することで、サンプル周波数を狭い範囲(上下600セント=半オクターブ程度)で変更した際に起こる不自然さを回避できます。特に人間の声の周波数を変更した際に経験される「チップマンク」効果を避けるために効果があります。(訳注:読者のバックグラウンドによってどこを突っ込むべきか違ってくると思うのですが、要はピッチシフトしても音色を一定にしたり逆に意図的に変えたりする話です。チップマンクchipmunkというのはシマリスのことらしいです。chipmunk effectというのは日本語でこれという表現があるかどうか分かりませんが、いわゆる「早送りしたときの甲高い音声」みたいなニュアンスで、音響方面というかDTM方面では一般的に通じる表現のようです。たぶん「アニメに出てくるネズミ系小動物の声優の演技(端的には「チップとデール」のアニメ)」とかから来た表現かななと想像します)|
Formants are frequency peaks/resonances associated with the size of noise-making objects (the human voice, piano, guitar etc). Formant preservation retains the natural sound of transposed samples over a limited range (+/- 600 cents) and so is particularly useful for avoiding the 'chipmunk' effect on vocals.|
|mixツマミ|Formant mix.|
***画像とプレーンについて
「ピッチ(周波数)」と「ゲイン(音量/振幅)」の情報は、それぞれ独立したプレーンの画像として扱われます。2つを合わせることであらゆる音声を生成できます。画像ウィンドウの「縦軸は周波数(各ピクセルが1つのpartialに相当)」、「横軸は時間」に対応します。
(訳注:突然サブタイトルに「planes」とかいう表現が出てきて全体としてどうしていいやらまだちょっと迷ってるんですが、図形を扱う方面の数学で「平面」に相当するのがplaneです。もっと平たく「高級な画像ソフトでいうレイヤ」とか「アナログ時代のアニメでセル画を重ねてるイメージ」とかあたりが「独立したプレーン」と言ってる意味です。)
**参考
***リシンセスのためにサンプルを読み込むには
+Harmorのプリセット「Template > Resynthesis」をロードします。
+「Image options」メニューから「Analyze audio file」コマンドを実行します。''または''、音声ファイルをHarmorのウィンドウにドロップします。
+必要に応じて:さらなる編集のため、画像シンセシスモードに切り替えます。
***リシンセシスで、ステレオのサンプルを読み込むには
+Harmorのプリセット「Template > Resynthesis」をロードします。ステレオのサンプルを扱う際は、このプリセットのように「PartBのADVセクションの「side」スイッチ(訳注:UNIT ORDERとかの右下あたりのimage/resynthesisのドロップリストの下にありまあす))がオンになっている」ことが重要です。
+PartAにステレオサンプルをロードします。
+PartBを開いて、同じステレオサンプルをPartBの側にもロードします。
+この状態で、A/Bフェイダー(訳注:Harmorの画面の真ん中やや左下にあるでっかい「AB」の文字の下にある横向きスライダー='Part A & B mix')は、Mid/SideのMixコントロールとして機能します。フェイダーを中央(50%)にすると、元のステレオサンプルと同じ音となります(訳注:特に書いてないけど'Enable Part B'スイッチはオンにしなくていいの?)。
+必要に応じて:PartAとPartBをリンクして、リロケーションを同期しておくなど(訳注:細かい意味はわかってません)。
***画像シンセシスを始めるには
+上記手順で音声を読み込んだ後にこれを画像として編集するには、「Image options」メニューから「Convert to image synthesis mode」コマンドを実行します。''もしくは''画像ファイルをファイルブラウザからIMGセクションの「image window」にドラッグ&ドロップします。
+image windowの上にある「COPY」ボタンを押します。
+お好みの画像編集ソフトを起動し、そのソフトでペースト操作をします。これで画像が編集できます。
+画像編集ソフトでコピー操作をして、HarmorのIMGセクションにペーストします。必要に応じて、画像編集ソフトで編集を続け、コピー&ペーストで更新して行きます。FREQ(周波数)とLEVEL(ゲイン)どちらのプレーンを編集しているかは、常に意識してください(訳注:IMGのデフォルト画面に書かれている通り、LEVELがRGBのG、FREQがRGBのBです)。
***ブラウンノイズによるウェイトについて
画像から音声を生成する際、ブラウンノイズによって調整されます。この調整は内容は、「HarmorのTimbreのHarmonics Editorでノコギリ波が水平線で表現される」仕組みと同じロジックです。これは「音としていい感じの波形」を直観的に作成しやすくするための仕様です。
**Image Synthesisアーティキュレータ一覧
-Image time offset - 上記'Start'に相当。
-Image fine speed - 上記'Fine'に相当。
-Image formant shift - 上記'Form'に相当。
-Image frequency pixel scale - 上記'SCALE'に相当。
**関連項目
【Harmorの資料】