A dōjin music circle
since 1998

博物館のある街リョドス
Lyodos the City of the Museum

何が何でもオーケストラ・吹奏楽アレンジのDTM音源の音圧を上げたい人のためのTips

0. はじめに

2000年代以降のDTMの普及および通信インフラの整備により、専門音楽教育を受けたことのない人でもオーケストラ・吹奏楽編成の楽曲を制作しインターネット上で発表することが可能となった。一方で公開されている音声データの品質はまちまちであり、楽曲はしっかり作られているはずなのに聞いた印象がしょぼい、ゆえに再生数が上がらず埋もれてしまう、といった例もあるようだ。特に動画サイトでは、音量が小さいとそれだけで稚拙な印象を与えてしまいがちである。

本稿では、あなたの作曲・編曲作品の音声データを、一手間掛けるだけで手軽にブラッシュアップするためのヒントを書き溜めていく。前提としてはフリーソフトをインストール可能なパソコンがあり、Audacity(ないしその他の音声編集ソフト)の初歩的操作を知っている人が対象である。

注記 1:アレンジ技術(オーケストレーション)にまつわる記事ではなく、音声データを弄る方法を解説しています。

注記 2:なお、フリーソフト・エフェクタはしばしば配布停止になったり、バージョン変更に伴い公開ページが移ったりすることがありますので、本ページ内からはリンクを張っていません。大抵は名称をネット検索すると公式サイトが出てきますので、そこから入手してください。

注記 3:本記事をこのようなタイトルで公開する是非については、正直迷った。というのも「音圧」という概念は、クラシック音楽に近しいと自認する(スノッブな)評論家の間では、むしろネガティブな印象を持って語られる語である。万が一この文章が一人歩きしたならば、DTMでのオーケストラ制作という行為に対する、音楽ファンの誤解と偏見を助長する虞はないとは言えない。

例えば知人のうちクラシック畑の幾人かは、そもそもオケのサウンドや興奮を打ち込みで再現できるわけが無いと(根拠無きままに)私に熱弁した。どうやら彼ら彼女らは、自分たちの高尚な音楽の領分をDTMという「万人に開かれた」テクノロジーに侵奪されることに対し、生理的嫌悪感を抱いているようなのだ。まあ気持ちは分からないでもない。作曲にせよ演奏にせよ、クラシックの職業音楽家を1人育成するために、少なくとも20~30年間の歳月と数千万円のレッスン費用が投じられている。それが安価なDTMで幾分なりとも代替されるのは、あたかも最新鋭の戦車がレジスタンスの路肩爆弾で撃破される様に似て、やられる側は忸怩たるものだろう。

もちろん打ち込みで作られたオケ編成の劇伴音楽など現在では珍しくないし、クラシックCDやコンサートホールのPAでもデジタルエフェクトを併用していると仄聞する。つまり、より良い表現をお客様に届けたいと考えた実務家たちの手によって、すでにDTM技術はオーケストラの世界に浸透している。

にもかかわらず、クラシックや吹奏楽の分野で作編曲を志すアマチュアの、ミックスに対する問題意識は立ち遅れている。心血を注いだはずのアレンジが貧弱な音源で再生され、聞き手は「DTMは生演奏の劣化コピー」という前時代的な思い込みを強化する。ならば求められているのは、ついに手の届くところまで降りてきたDTM技術と、右も左も分からないけどオケ曲を作ってみたいという初心者との、橋渡しに他ならない。

そして音圧を上げるという行為は、DTMの学習に明確な指標を与える。音圧にかまけて音楽を犠牲にしてはならないが、音圧の稼ぎ方すら知らないようでは、ミックスの基本を理解していないも同然である。

1. 本当の初心者が最低限すべきこと

1-1. ノーマライズ

ニコニコ動画に吹奏楽作品をアップロードしている人たちの少なからぬ割合が、Finale等のノーテーションソフトから書き出したwaveファイルを無加工のまま動画化している。このとき大抵は音量が小さすぎるか、さもなくばピーク音量時に音割れしているかのいずれかである。

大原則として、ノーテーションソフトはtutti時でも音割れしない程度に、設定音量を下げてから作業するものだ。バウンス(wave書き出し)した後で、Audacity等の音声編集ソフトに取り込んで、まず「ノーマライズ」(日本語では正規化)を行う。これは、曲の各部や左右ステレオチャンネルの音量バランスを変えないまま、全体の音量をあるレベルまで増幅する処理である。とりあえず −1 dB あたりを目安に掛ける(デジタル信号としての強度が最大になるのは 0 dB だが、以降の加工中や音声圧縮時に音割れしないよう余裕を持たせる)。

2. 手っ取り早く音圧を稼ぐ

バウンスした直後の音源はしばしば、瞬間的に最大音量となるところが出来てしまい、そこに合わせてノーマライズが行われる。このままでは他の箇所は信号レベルが小さいので(Fig. 1)、レベルが最大になる瞬間だけ、音量を下げてやる。手段としては、マキシマイザかリミッタを使うのが手軽である。

ノーマライズ直後
Fig. 1 | 元データを0 dB にノーマライズした直後。図中のカーソル箇所が最大の信号レベルで、ここが突出しているせいで他の音量が小さくなってしまう。

2-1. マキシマイザ一発で済ませる

ノーマライズしてから、「マキシマイザ」と呼ばれるエフェクトを掛けてハイ出来上がり、とするだけの方法。文字通り、聴感上の音量を「最大化」するために設計された専用のエフェクタである。Windows PC + Audacityで作業環境を作るならば、buzmaxi3というプラグインを使うのが簡単だ。具体的な使い方は......まあネット上に日本語情報が幾つかあるので参照してください。

2-2. リミッタを掛ける

これもノーマライズを行ってから掛ける。基本的には、曲中で極端に突出した部分(打楽器の打点の瞬間)だけが潰れ、その他通常の演奏部分が飽和に達しない程度に閾値を設定する(Fig. 2)。

リミッタ
Fig. 2 | Fig. 1のデータを、W1というプラグインを使用し、threshold = −3.7 db としてリミットした結果。

上記2つの手段の内、いずれかを好みで実施する。これだけで相当に音圧が上がる。というより十分すぎるレベルであり、初心者はこれ以上やってはいけない。

2-3. トータルコンプ(非推奨)

「トータルコンプ」という名前のエフェクタがあるわけではない。compressingとは、ある閾値を超えた信号強度の増加レートを一定の割合でなだらかにする処理を指す。これにより大きな音と小さな音の信号強度差が圧縮されるので、さらにノーマライズしてやれば、もともと小さな音であった部分は結果的に音量レベルが上がっているという寸法だ。で、全楽器トラックをまとめて書き出した(ミックスダウン後の)音声データに対してコンプレッサを掛けるのが、トータルコンプである。

ただし、この処理を行えば当然、楽曲におけるフォルテとピアノの違いは少なくなる。クラシック系の音楽はそもそも、単純な音量の大きさを競うものではない。曲中の場面ごとにオーケストレーションの厚みが変われば、それに合わせて音量も増減するのは当然であり、むやみに音量差を潰して良い局面というのはせいぜい、車載BGMの専用音源くらいだろう。オケサウンドに深いトータルコンプを掛けるのは、奨められない。

3. 楽器トラック単位で弄る(中級者以上向け)

ここまではミックス後の音に対する処理を説明してきたが、さらに細かく弄りたい人は、各楽器トラックに対して(必要ならばMIDIレベルまで戻って)調整を加えることになる。労力を考えるとDAWの使用がほぼ必須(フォーピースのロックバンドならともかくオケは30, 40トラック使うことがざらなので、律儀に全トラックwaveに書き出すと大変なことになる)。

楽器トラック単位で操作するものとして、コンプとフェーダー(トラックの音量レベル)、EQが主な処理になる。他にリバーブやディレイもミックス作業全体では頻出するが、音圧上げの観点からは外れるため、本項では解説しない。

3-1. コンプレッサ

コンプの使い方としてはまず、サンプルの収録音量が不均質なときレベルを揃えることができる。加えて、音の立ち上がりが弱すぎる場合に勢いを加えたり、減衰のキャラクターを生み出すことが可能だ。基本的には、音源の生音に他のエフェクトを全く加えていない状態で、トラックをソロで再生して最も自然なフレーズ感を得られるように調整する。

3-2. フェーダー

コンプレッサが音のキャラクタを決めるために使われるとしたら、フォルテやピアノに伴う音量変化そのものはどのように作るか。基本的にはMIDI打ち込みの段階で、ノート単位の強弱をVelocityで、各音の減衰処理をExpressionで弄る(これは一般的なMIDI音源に対する制御方法で、音源によっては別のパラメータを使う。たとえばVOCALOID2ではVelocityの代わりにDYNとBRIで強弱を付ける)。それだけで対処できない部分(e.g. オーケストレーションの厚みの変化に、各楽器トラックのボリューム変化が追随できず音が埋もれてしまうとき)について、フェーダー操作(エンベロープ)で強弱を作る。

ただし、トラックの音量レベルを変更すればパート間の音量バランスも変わってしまい、やり過ぎると作業基準が分からなくなる。ポップスの場合はベースやドラム等、曲中を通じて常に同程度の強さで仕事をしているリズム隊がいるので、そこを基準に他楽器の音量バランスを取っていけばいいのだが、クラシックや吹奏楽でこれをやるのは意外に困難である。

個人的にはチューバ、トロンボーンあたりをほぼ音量固定にして、それにトランペットを載せ、次いでホルンをはめ込む。さらに金管セクション全体とのバランスをとる形で、ファゴット、クラリネット、オーボエ、フルートの順にフェーダーのレベルを決める。オーケストラの弦5部、ないし吹奏楽のサックスは極めてダイナミクスの自由度が高いので、最後にはめ込む。

4. イコライザについて

イコライザ(EQ)とは、波形信号のうち、特定の周波数域(音高)について信号レベルを大きくしたり小さくしたりするエフェクトである。大別してパラメトリックEQとグラフィックEQの2種類が存在する。本格的にMIXしたいならば、それぞれについて使えるエフェクタをまずは入手しよう。下記の処理に関しては、個人的にはMac OS X に標準で入っているAudio Unitの10バンドグラフィックEQを好んで使っている。

4-1. 音色作りとしてのイコライザ

EQは効果的に使えば品質を向上させられるが、慣れを要する。ポップスやロックではEQを楽器の積極的な音色作りに使う。例えばドラムセットのバスドラやスネアは、音作りの初期段階でコンプとEQをゴリゴリ掛けてキャラクターを変化させる。ストリングスも同様の処理で、存在感を増したり減らしたりできる。

ところが、ホーンにこれをやると生楽器感が失われ、ひどく不自然な演奏になる(実在しない楽器をシミュレートしたいなら話は別だ)。トラック単独でプレビュー再生する時点では、EQを顕著に動かして良い管楽器は限られており、それはサックスである。市販のサックス音源の大半はジャズ等での使用が想定されており、無加工のサンプルを吹奏楽の打ち込みに使うと、音がギラギラしすぎて気持ち悪い。これを、高音域をEQで削ることで解消する。なお、トロンボーンの最強奏がバリバリ言い過ぎる場合も高音域を削れば、適度に引っ込んだ音を得られる。

他の管楽器については、ハイをあまり削らない方がいい。というのも10000 Hz を超える高音域をEQで下げると、トラック単独での再生時には違和感を覚えないレベルの下げ方であっても、他のトラックと混ぜた途端に楽器特有の音色が損なわれるためだ(オケ全体として、いかにもMIDI風味の仕上がりになる)。また、他パートとの相対的な音量不足によりフレーズが聞き取りにくくなることがある(マスキングに起因する問題)。

(ハイパスフィルタ)

他に楽器単位で掛けると良いかもしれないエフェクトとして、ハイパスフィルタ(HPF)がある。これは、低音域の信号レベルがミックスダウン時に飽和する(バス音域の楽器が、他のトラックに混入している収録時のノイズによって邪魔される)のを防ぐための措置で、基本的に各楽器の最低音より下を閾値にする。特に生音を録音した場合は、交流電源や環境に由来するノイズが入りやすいので掛けた方がいい。

4-2. パート間でバランスを取る手段としてのイコライズ

唐突に話は変わるが、DTMに興味があってミキシング技術の関連文献を漁ったことのある人なら大抵は、「ミックスは引き算」といった感じの言葉に心当たりがないだろうか。本項では今まで(面倒臭くて)説明していなかったのだが、これこそがオーケストラ・吹奏楽のミキシングにおける第一原則と言い切っても良い。同時に、最も実践の難しい原則でもある。

オケ編成での打ち込みでは、これが特に問題となる局面がある。すなわち、各楽器パートをソロ再生した場合には良い音色で鳴っており、セクション内のほかの楽器との音量バランスも大きく外していないはずなのに、いざ全パートでバウンスしてみるとその楽器パートが十分に聞こえない、あるいは音色に張りがないといった場合である。このとき初心者が陥る罠が、問題のパートのボリュームそのものを上げて乗り切ろうとする試みだ。これがなぜ悪いかというと、ある楽器の音量を上げるということは他の楽器が聞こえにくくなるということであり、じゃあ他のパートもボリューム上げて......となると永遠に解決しない。

この問題の根本は、我々の耳が倍音のバランスによって楽器の音色を聴き分けているという、まさに音楽の基本原理にまで遡る。管弦楽の楽器はいずれも豊富な倍音成分を含むため、思った以上に高い周波数成分でも強い信号レベルを維持している(楽器には音域の上限と下限があるが、その楽器から発せられる音声信号の音域に上限は無い)。この状態で数十種類もの楽器を、たった左右2つのチャンネルに混ぜ合わせればどうなるか。高音域では全ての楽器の倍音成分が相互にマスクし、信号レベルはたちどころに飽和するし音色は聞き分けにくくなる。

ここで重要となるのが引き算によるミックスである。各楽器の倍音成分(=高周波数域)のうち、なるべく音色を損なわない帯域のボリュームだけを削ってやり、その部分に他の楽器が入れるスペースを空けてやるのだ。ここでイコライザの本領発揮となる。

バランス目的でのEQ操作は、他の楽器トラックと一緒にプレビュー再生しながら実施する。最初に、

  • ホール後方で聴くと比較的まろやかな音になるであろう楽器、例えばホルンの、10000 Hz以上を 1, 2 dB 削る。
  • 逆に、プレビュー時に音の透徹感が足りないなと感じた楽器(特にトランペット等、ホールの後方までガツンと生音が飛びそうな連中)はハイをやや持ち上げる。

次にtutti部分をプレビューし、

  • 極端に聴こえにくいパートがあれば2000~8000 Hz のどこか1ポイントを、2 dB程度持ち上げる。
  • 複数の楽器にこれを行う場合、持ち上げるポイントを楽器ごとに変えて中高音域の飽和を防ぐ。
  • 基本的に高音域を持ち上げるほど、煌びやかな音になる。
  • 元から十分な存在感のあるパートは、一千Hz域を削ってやってもいいのだが、削りすぎると今度は逆に、オーケストレーションの薄い箇所で音色に違和感を覚えることがある。個人的にはそこまで弄る必要は無いと考えている。

なお細かな注意・補足として、

  • 上の処理はリバーブ等のエフェクトを挿した後に、最終調整のつもりで実施すること。わからない場合は極力いじらない
  • 飽和を防ぐ方法として、ステレオの左右定位をずらすというものもある。これについては別稿で解説する。
  • 同様に飽和を防ぎつつメロディ(ソロ)楽器を目立たせる技術として、発音タイミングを少し前にずらす方法、ピッチを上寄りに取らせる方法、さらにフォルマントを持ち上げる方法などがある。これらは現実世界のミュージシャンも使用する演奏テクニックであり、ピッチ補正機能(たとえばLogic Pro X のFlex Pitch)が強化された最新のDAWならば相当程度まで真似できる。

蛇足だがロックやダンスミュージックの編成にブラスを混ぜる際は、数千 Hz 域の持ち上げをさらに顕著に、例えば +4 dB などのレベルで行う。リズム隊が常に帯域を占有している中で、ボーカルをマスクせず、なおかつブラスサウンドをピンポイントで耳に入れるためのテクニック(フェーダー操作だけでは困難)なので、覚えておくと便利。