|
人の声の元になるのは声帯の振動ですが、これは発音する言葉が違ってもほとんど変化することはありません。では、なぜさまざまな言葉がしゃべれるのかというと、口の開け方や喉の形などによって生じる共振や共鳴、そしてそれに付随する摩擦音や破裂音などが声帯の振動に付け加えられることでさまざまな言葉になるわけです。 声には、特定の周波数領域にスペクトルが集中して盛り上がっている部分が何カ所もあります。 このスペクトルの山は、フォルマントと呼ばれていて、人の声が言葉として聞こえるための重要な要素になっています。 有声音と無声音) 声に含まれるフォルマントの数や、各フォルマントの周波数や振幅、帯域幅などは声の性質を決める要素であり、声を出す人の性別 や体格、年齢などによって大きく異なります。 しかし、たとえ誰が喋っていても、「あ」は「あ」であり、「い」は「い」であり、言葉は同じように聞こえます。実は、人の声では発音する言葉の種類ごとに、特徴的なフォルマントの組み合わせが決まっています。声質が違っていても多様な言葉を聞き分けることができるのはそのためです。 フォルマントの種類を大別すると、有声音(*)を合成するためのピッチを持った有声フォルマント、無声音(*)を合成するためのピッチ情報を持たない無声フォルマントがあります。 HV音源部は、8個のフォルマント周波数を作り出し言葉を発音する仕組みを実現します。
| ||||||||