周波数

その他

音の世界の物差し:メル尺度

私たちが日々耳にしている音は、空気の振動によって生まれます。この振動の速さを表すのが周波数で、単位はヘルツ(Hz)を用います。周波数が高いほど高い音、低いほど低い音として感じられます。たとえば、ピアノの鍵盤で言うと、右に行くほど高い音になりますが、これは、鍵盤を叩くことで発生する振動の周波数が高くなるためです。 しかし、人間の耳は、すべての周波数の音を同じように聞き取れるわけではありません。周波数の違いを聞き分けられる能力は、周波数帯域によって異なり、特に低い周波数帯域では、その差を認識するのが難しくなります。例えば、1000Hzと1100Hzの音の違いは、多くの人が簡単に聞き分けられます。これは、100Hzの差が、1000Hzに対しては大きな変化として認識されるためです。一方、100Hzと110Hzの音の違いを聞き分けるのは容易ではありません。これは、100Hzの差が、100Hzに対しては、相対的に小さな変化としか認識されないためです。 このように、人間の耳は、高い音ほど周波数のわずかな違いにも敏感ですが、低い音は、周波数の違いを大きくしないと、別の音として認識することができません。これは、人間の聴覚の特性の一つと言えます。
音声生成

音声の謎を解く:フォルマント周波数とは?

私たちは、日常的に相手の声を聞き分け、誰の声かを認識しています。声には、高低や強さだけでなく、一人ひとり異なる個性的な特徴、すなわち声色があります。この声色の違いを生み出す要素の一つに、「フォルマント周波数」と呼ばれるものがあります。フォルマント周波数とは、人間の声が持つ音響的な特徴の一つで、音声のスペクトル分析を行った際に現れる、ピークの周波数のことを指します。 例えるなら、人間の指紋のように、声にも固有のパターンが存在すると言えるでしょう。同じ「あ」という母音を二人の人が発声したとしても、全く同じ音に聞こえるわけではありません。これは、声の通り道である声道(声帯から唇、鼻腔までの空間)の形状が人によって微妙に異なるためです。声帯で発生した音が、この声道を通過する際に共鳴し、特定の周波数が強調されます。この強調された周波数がフォルマント周波数であり、この周波数の違いが、私たちが聞き取る声色の違いとなって現れるのです。 フォルマント周波数は、音声認識や話者識別など、様々な音声技術に応用されています。声紋認証も、このフォルマント周波数を利用した技術の一つと言えるでしょう。
アルゴリズム

音の高さを測る: メル尺度とは?

私たちは日頃から、鳥のさえずりや虫の声、楽器の音色など、様々な音を耳にしています。これらの音の違いを聞き分けることができるのは、音の高さ、つまり「周波数」の違いを感知しているからです。周波数は音の波が1秒間に何回振動するかを表す数値で、単位はヘルツ(Hz)を用います。周波数が高いほど音は高く聞こえ、低いほど低く聞こえます。 しかし、人間の耳は、すべての周波数の音を同じように聞き取れるわけではありません。一般的に、人間が聞き取れる周波数の範囲は20Hzから20,000Hzと言われていますが、すべての周波数で同じように敏感に音を感じ取れるわけではありません。例えば、1,000Hzと1,100Hzの音の違いは、ほとんどの人が容易に聞き分けることができます。しかし、これが100Hzと110Hzとなるとどうでしょうか。同じ100Hzの差ですが、低い音になるにつれて、その違いを聞き分けることが難しくなります。 これは、人間の耳が、高い周波数の音の変化には敏感である一方、低い周波数の音の変化には鈍感であるという特徴を持っているためです。 特に、人間の会話で多く使われる周波数帯である1,000Hzから4,000Hzの音に対しては、非常に敏感に反応するようにできています。そのため、この周波数帯の音の変化を聞き分けることで、言葉の微妙な違いや感情を読み取ることができます。このように、人間の耳は、周波数によって音の感じ方が異なるだけでなく、生活に重要な音に対してより敏感に聞き取れるように進化してきたと言えるでしょう。