トップへ戻るhome
JUNGER_LOGO

Jünger Top | 日本語取扱説明書&技術解説 | 企業情報

日本語取扱説明書&技術解説:適応的ラウドネス自動制御

一覧に戻る

ラウドネス制御をオートメーションに統合する道を提供するマルチループ・テクノロジー

今日、私たちはオートメーションの世界に住んでいます。この業界でも毎日の仕事でも自宅においてもオートメーションは目に入ってきます。そこには人間の仕事を機械で置換することでスピードを速めるように設計された技術があります。

放送業界もこのルールの例外ではありません。オートメーションは至る所にあり、技術で高速化を図る傾向は顕著です。インターネットが音声と映像を広める新たな手段を提供してくれた今は特に。私たちが制作と配給に信用して使ってきた従来の技術はこの新しい世界を包括するように変化しています。そしてそのことが人手による制御の影響をさらに減らしています。このことは次のような疑問を投げかけます:このような変化は私たちの動画と音声の受け取り方を変えるでしょうか? このように高度に自動化された放送の世界にも音声信号の人手による制御を残すべきでしょうか?

放送施設に対する印象

全自動のテレビ放送施設を想像してみると、2 つのことがすぐに心に浮かびます。最初のものは私が「フリース・ジャケット・シンドローム」と呼ぶものです。冬かと思うほど空調温度がいつも下げられているので、外がどんなに暖かくても中にいる皆はフリースの上着やセーターを着ているという状況です。メーカー側がフリースの上着をプレゼントしようとすると放送局側がかくもがっついて持って行くのも不思議ではありません。

私が抱く第 2 のイメージはコントロール・ルーム —— 薄暗い照明と威圧するようなビデオ・ウォール上に映像がちらついている広い場所 —— のものです。入力チャンネル、伝送チャンネル、専用回線等 ... 世界のどこであってもこのようなコントロール・ルームはどれも似たように見えます。ビデオ・ウォールの前には、いくつものコントロール・パネルやインターカムを備えた大きな卓が必ずあり、プログラム・リストやスケジューリング情報や伝送信号の状態やおそらくは衛星回線の設定も示すコンピューター画面もあります。そこにあるすべてのものは制御される必要があるはずですが、それをする人々は皆どこにいるのでしょう? 普通はごく少数しかいません。マルチスクリーン表示上の個々のチャンネルの画像はチャンネル名とビデオ・コンテンツについての視覚的情報を提供します。流れている音声について何事かを伝える何らかのバーグラフ的な視覚表示もあるかも知れません。ここにいるエンジニアは処理に使われている様々な機材の動作を監視しています。オーディオとビデオの品質モニタリング用の端末があるかも知れませんが、どんなコントロール・ルームにもそれがあるとは限りません。完全自動化された送信センターとはこんな感じのところです。事実、このイメージは世界中あらゆる場所の放送センターや中継施設、衛星中継の地上通信センター、ケーブル TV や IPTV の中継局の実態です。

このような施設の 1 つに行ってオーディオ・フェーダーやビデオ・スイッチャーを見つけようとしても、見つからなくてがっかりすることでしょう。スイッチャーやフェーダーを制御する人すらいません。現代の施設ではスタッフは何テラバイトもあるハードディスクを備えた巨大なサーバーに保存されるデータを管理しています。プログラミングされたスケジューラーが何百ものテレビ・チャンネルの送り出しを実行します。行われているモニタリングは主に送り出されているビデオとオーディオの基本的な状態を制御するものです。ここには品質モニタリングはありません。

このような環境では、専用伝送もしくは配給ネットワークのそれぞれについて、オーディオとビデオのための何らかの品質規格が保たれていることをどうやって保証するのでしょうか? これは微妙な問題です。というのも自動化された施設では人的な労力を最小限に抑えながら最良の結果を達成する必要があるからです。

映像の内容については、制作の全過程を通じてビデオ信号は法的な伝送要件から外れないように数多くの専用制御にさらされるので、それほどは難しくありません。ビデオのフォーマット変換は一般的で、色々な性能レベルのものが利用できます。ビデオはデジタル・ドメインでは圧縮フォーマットで搬送されるデータですし、用いられる圧縮機材はどれも伝送信号にとって許容帯域幅内で出来うる限り最上級の信号の質を保証するためにいくつものビデオ・フィルターやアルゴリズムを使っています。

しかし、オーディオとなると話は違います。もちろん、音声を信号の伝送に必要とされるフォーマットに変換し、最良の音声性能を保証するのに必要な技術仕様に合致するように設計された技術は市場にあります。しかし、似ているのはここまでです。というのも、音声に関しては内容をチェックしたり合法化するために作られた共通の全体的な技術仕様が存在しないからです。

確かに音声技師たちは技術的な勧告をいくつか利用できますが、問題の解決にならない場合もあります。例えば音声がデジタル・ドメインへと符号化されたのであれば、レベルが取り得る最高の値は 0 dBFS のはずです。しかし、その基本的な勧告はデジタル音声を扱うのに使える様々に異なる実践的な方法を実際には反映していません。例えば CD の音声を考えてみましょう。16 ビットのオーディオ解像度では、CD の音声は利用可能な符号化空間のほとんどすべてを使っています(理論的には 96 dB のシステム・ダイナミクス)。これは、放送局が CD から音楽を利用する場合、CD 音声はは制御されて最大値としての 0 dBFS に到達するようにマスタリングされるということを意味します。これは、ITU や EBU や ATSC のような国際的な監督機関による勧告に準拠するために現在は -18 dBFS か -20 dBFS を基準レベルとして使っている一般的な放送信号とはかなり違います。これが放送局にとってどういう意味かというと、異なるソースから持ってきた音声コンテンツのレベル状態は大いに異なっている可能性があるということです。CD からの音声コンテンツは、標準的なテレビ放送から採った音声の 2 倍以上うるさいこともあり得ます。

プログラムのラウドネス差は苦痛

業界として、放送で用いられている音声ソースのレベルに大幅に違いがでる可能性があることを私たちは皆認識しています。もちろん、未処理で品質管理されていないものが送出されることはありませんが、音声レベルと音声制御に関しては取り組まなくてはならないいくつもの問題がまだあります。

この 10 年をかけて、音声を高品質で伝送することについては、技術志向のレベル制御が自分たちの問題を必ずしも解決しないことを放送局は理解し始めました。現在、音声のラウドネスは議論の的であり、この問題を扱い背景知識を与える多くの記事が公にされています。簡単に言うと、ラウドネス制御の処理がされた音声ソースはどれもラウドネスの全体的な印象が同じにならなくてはならない、ということです。そして適切なラウドネス制御はデジタル放送システムの音質を確実に改善します。

自動化された放送という今日の世界にラウドネス制御がどのように適用されるか、が問題として残ります。この制御を行うには放送局には、統合されたものであれ外付けのものであれ音声処理を用いるしか選択はありません。私はすでに、ある人々(大半は熟練音声技師)がこの断定に対してぶつけるであろう不満を想像できます。自動化されたオンラインのラウドネス制御が耳にどれだけ心地よいか、そしてどのようにして音声に有害でない方法で行われるのかを尋ねるであろうことは分かります。

このような人々の懸念は理解できますが、オートメーションが最重要な世界では他に選択肢はありません。なぜなら放送局が適切なモニタリング及びフェーダー・コントロールを備えた音声ブースを作り、そこに誰かを入れてこのタスクを手動で行わせるということはまずありえないからです。放送局がこの新しいラウドネス規格及び勧告に従い、そして自局の視聴者のために最高度の品質を保ちたいのであれば何らかの自動的な音声制御が必要であることを認めなくてはなりません。

他に選択肢はないと仮定して、議論の余地があるのは、このオンラインの自動ラウドネス制御システムがどんな特性を持つべきか、です。

アダプティブな音声制御

普通のライン・アンプと違って、ラウドネス・コントロール・プロセッサーのゲインは一定ではありません。このゲインはラウドネス・プロセッサーの制御アルゴリズムや入力信号の変化するラウドネスと振幅に応じて時とともに変化します。ゲインのこのような変化(これは実際の制御過程なのですが)は音声信号自体に邪魔になるような副作用(ポンピングや歪やカラーレーションやノイズ変調のような効果)を発生させないように生じなくてはなりません。言い換えるならば、ゲイン変化は聴いてもわからないようにされる必要があります。

ラウドネス制御要素のアタック・タイム・パラメーターの設定はその機器がどのように音声信号内の速い振幅変化に反応するかに影響します。長いアタック・タイムはオーバーシュート(そしてその結果の歪)に繋がりかねません。なぜならそのシステムはゲインを低減できるほど十分な速さを持っていないからです。短いアタック・タイムはオーバーシュートが発生する機会を最小限にしますが、そのような場合のもっと速いゲイン変化はクリックや他の変調のような耳に付く副作用を持ちます。

ハードウェア及びソフトウェアによる制御ユニットを開発するのにシングルバンド・デザインとマルチバンド・デザインが使われており、アーキテクチャーによってはどちらのデザインも申し分のない仕事を行うことができます。シングルバンド・デザインが提供する長所の 1 つは、これがサウンドにはタッチしないことにあります。というのもフィルターが含まれていないからです。

疑問が出てきます:使用中は回路を再調整する機会がないのであれば、なし得る最上の性能をどうやって保証できるのでしょうか? 人が不在のときに必要なのは、適応的であり人間が操作したかのように動作するシステムです。そのようなアルゴリズムは利用可能なリソースに基づいてその動作を変える必要があり、そのためにこそマルチループ原理が必要なのです。

私はマルチループ方式を使うことをお薦めします。なぜならこれが最良の解決策であると信じているからです。様々なループのそれぞれが周波数スペクトラム全体に対して機能します(ワイドバンド)。個々のループはそれぞれがアタック及びリリース・パラメーターの異なるセットを持って平行して動作します。各ループは制御信号を作り出し、それが他のループからの制御信号とサミングされ、1 個の最終的ゲイン制御要素に適用される単一のゲイン制御信号となります。

個々の制御信号をサミングする方法は独自の技術を必要とします。マルチループ・デザインをデジタル的に組み込むことによって音声信号経路に短い遅延時間を持たせることができます。これによってゲイン変更要素に「先読み」させて、最も速いトランジェントであっても制御に間に合うように、遅延済み信号に適用する前に、必要な補正を決定することが可能になります。絶対にオーバーシュート(クリッピング)のない、正確に均された出力信号を提供するリミッターにとってこれは特に重要です。図 1 をご覧ください。

このマルチループ・デザイン内で用いられている独自アルゴリズムは入力信号の経時的な変化にしたがったアタック及びリリース・タイムの自動調整も可能にします。これを「アダプティブ(適応的)なラウドネス制御」と言います。入ってくる音声を分析することによって、このシステムは定常的な信号状態のときは比較的長いアタック・タイムを設定できますが、インパルス的なトランジェントのあるときは短いアタック・タイムを設定できます。

図 1 マルチループ・デザインをデジタル的に組み込むことによって音声信号経路に短い遅延時間を持たせることができます。これによってゲイン変更要素に「先読み」させて、最も速いトランジェントであっても制御に間に合うように、遅延済み信号に適用する前に、必要な補正を決定することが可能になります。


結語

懐疑的な評論家の見解もありますが、アダプティブなマルチループ・テクノロジーはオーディオ制御システムをフルオートの放送システムに統合する方法を提供します。ファイル・ベースの制御という考え方が放送コンテンツのすべてをカバーするとは限らないことは明らかです —— 少なくともテレビは生番組を持ち続けるからで、そしてたとえテープレス・テクノロジーが採用されても、このコンテンツはライブのままです。一般的な放送施設では、適切な出力信号条件をいつでも、またソースとは無関係に保証するために、ファイル・ベースのコンテンツ制御とストリーム・ベースのコンテンツ制御のミックスは保たれ続けるでしょう。

オートメーション化されたマルチチャンネル・コントロール・ルーム環境におけるエンジニアの仕事に関しては、どんな種類の信号処理も「一旦設定したら忘れてしまう」ようなソリューションである必要があります。なぜなら特に音声には誰も人をこのタスクに使う時間やリソースを持たないからです。このような場合、「自動化された」そして「高品質の」リアルタイムのオンライン処理アルゴリズムを生み出す唯一の方法はアダプティブなテクノロジーを使うことです。現行の様々な規格や勧告の要件すべてを満たすと仮定して、そのようなアダプティブなテクノロジーは、完全自動化システムに最良の音声制御性能を保証してくれるでしょう。



マレーシアの放送局 Astro は Cyberjaya の施設に Jünger Audio の LEVEL MAGIC 自動化音声処理を 30 チャンネル以上設置しました



タイ及び東南アジアのケーブル及び衛星テレビジョン・プロバイダー True Visions は自局のペイ TV チャンネル間の音声レベルのバランスを取るために LEVEL MAGIC 自動化音声プロセッサーを設置しました