音声認識ソフトに向かって「vote」と発音したつもりのに、「boat」と文字がでてきたら、どのように改善すればよいのでしょうか?
実はやみくもに何回も発音しても正しい結果に到達することはできません。
まずは原因を探り、その後で具体的な
改善方法をみていきましょう!
※音声認識は「Google翻訳」で手軽にできるのでぜひお試しくださいね。
本記事で掲載しているMRI画像は「University of Southern Californial」の許可を得ています。
「vote」と「boat」両方の発音記号を書き出しましょう
発音の練習というと、発音したい単語の発音記号だけをチェックしたい気持ちは分かります。でも、それでは間違った単語の発音と比較することができません。ですから間違った単語の発音記号も必ず書き出してください。
発音記号は、辞書によってバラツキがあるので使う辞書は1つに絞りましょう。私はオンライン辞書の「Cambridge Disctionary」をオススメしています。理由は国際基準の発音記号を採用しているからです。
発音記号を書き出すときは、以下のように正しい単語を上に、間違った単語を下に書きます。上下に書く理由は、音節や音素を照合しやすいからです。スペルの右側には発音記号を、その右に意味を書きます。
日本語の意味を書くことにより、間違って伝わった発音は、意味がまるで違って伝わっているのだとハッキリと分かりますよね?
「投票」と言っているつもりなのに「船」と
伝わっていたら会話が成立しませんよね?
スペル | 発音記号 | 意味 |
vote | / voʊt/ | 投票 |
boat | / boʊt/ | 船 |
自分が伝えたい内容を正しく伝えるためには発音は必須です。
何をどのように改善すればよいかが見えないから「発音は難しい」というイメージが先行してしまうんですよね。でも、難しく感じることも紐解いていけば、実は自分の力である程度は改善ができるのです。
2つの発音記号を上下に並べて「音節の数」「強勢の位置」を確認する
ここからは音節の数と強勢の位置に焦点を当てていきます。発音記号に焦点を当てるために、スペルと意味は削除しました。今から行う手順は「母音の数」を手掛かりに、音節の数を確認することです。
voteもboatも1音節です。では、なぜ1音節だと分かるのでしょうか?
1つの音節に母音は1つ。/voʊt/は母音/oʊ/が1つなので1音節となる。
次に、強勢の位置も確認です。今回は1音節なので当該の音節に強勢が乗りますが2音節以上の強勢の乗り方も知っておきましょう。
※1音節の単語のばあい自ずと当該の音節に強勢が乗る。
※2音節以上の単語では「強勢が乗る音節」と、「強勢が乗らない音節」に分かれる。
ここまでで、voteもboatも1音節なので「当該の音節に強勢が乗る」ということがわかりましたね?
1音節・当該の音節に強勢が乗る |
/voʊt/ |
/boʊt/ |
「音節の数」と「強勢の位置」は次に学ぶ「音素」と同じくらい重要なのに、意外と見過ごされがちです。「音節」の概念が分かりにくければ、以下のように考えるとわかりやすいかもしれません。
「音節」=「音素が入る箱」
正しく音声認識されないばあい、そもそも「箱」の数が正しく認識されていないことが多いのです。今回は1音節、つまり箱の数は1つなのですが、箱の数が2つ以上になると強勢が現れますが、これも見過ごされることが多いです。
もし「強勢」の概念が分かりにくければ、以下のように考えてみてください。
「強勢」=「箱の大きさ」
「強勢が乗る」とは「箱が大きい」、そして「強勢が乗らない」とは「箱が小さい」ということです。
voteとboatは1音節なので「大きい箱が1つ」と考えるといいですね
2つの発音記号を上下に並べて同じ音素と異なる音素を洗い出す
以下のように音素単位で上下を比べてみると音素が同じか違うかがハッキリと分かりますね?
「音素」とは意味の違いに関わる最も小さい音の単位です。音素は/v/のように/ /で囲みます。
では、音素ごとに2つの単語を照合してみましょう。
縦で照合すると/oʊ/と/t/は「〇=同じ」ですが、/v/と/b/は「✖=違う」ということがわかりました。つまり、出したい音は/v/なのに、実際に出た音は/b/として相手に伝わっているというです。
✖ | 〇 | 〇 |
v | oʊ | t |
b | oʊ | t |
/v/と/b/が違うことで意味が変わるので
「/v/と/b/は音素だ」といえますね。
ここまで細かく分析して初めて「問題の特定」ができるのです。問題が特定できたら次は、それぞれの音素の口の形を学んでいきます。
/v/の口の形(唇・舌・顎)や声の出し方(有声・無声)を確認する
まず、本来出したかった/v/の音を作るために、どのような口の形や音の出し方をすればよいかを具体的にみていきましょう。
口の形をデフォルトの形と/v/を発音中の形を断面図で確認する
口の中は、正面から見ただけではあまり見えないので、MRI(磁気共鳴映像法)を使った専門的な断面画像を確認していきましょう。
左は口を軽く開けただけの画像で、これを「基本形」とします。このとき、舌はある程度平たいことがわかります。
右が/v/を発音中の画像です。上の歯先と舌先が軽く接触していることがわかります。
/v/を発音するときの筋肉の使い方を断面図で確認する
ですが、これだけではまだ分かりにくいので、もう少し情報を入れた画像を以下でご確認ください。
左下の画像は/v/を発音するときに特に使う部分です。/v/を発音中は上と下の筋肉を使います。
右下の画像は/v/を発音するときの筋肉の方向を示しました。下唇の少し粘膜側に上の前歯が接触します。
/v/を発音中に正面からみると口角が下がります。
下唇を上に押し上げているからですね。
/v/は声が出る「有声音」
口の形がわかったら、次に有声音か無声音かを確認しましょう。/v/は声帯の振動がある「有声音」です。
/v/の口の形を作り、同時にしっかりと声を出しましょう。/v/の音は「摩擦するうなり声」のように聴こえます。
有声音とは声帯を振動させて出す「声が出る音」・無声音とは声帯を振動させない「息だけの音」です。
摩擦音は吐く息の「勢い」と「継続性」も確認する
/v/は摩擦音グループに属します。
摩擦音グループに属する音素は全て「狭い場所から息を押し出すように」吐くときに、摩擦が起こります。狭い場所の「狭さ」によって摩擦の度合いや音質が変わります。
/v/は上の歯先と下唇を軽く接触させるので、吐く息がスムーズに口から出られません。そこで摩擦が起こるのですが、無理やり息を押し出しているので吐く息の勢いは柔らかくなります。
また、摩擦音グループに属する音素は「継続する音」です。だから/v/を発音するときは一定時間/v/の音が継続するように発音してください。
ブツッと切るように発音すると、/v/の口の形を正しく作っていても他の音素として認識されるので注意してくださいね。
/b/の口の形(唇・舌・顎)や声の出し方(有声・無声)を確認する
ここからは、間違って認識された/b/の音が、どのような口の形や音の出し方で発音されたのかをみていきましょう。
/b/の発音には①閉鎖 ②開放 の2種類がある
/b/の発音には2つの動作があります。
左の画像のように両唇を閉鎖している時、息を吐きたいのに吐けないので肺から上がってきた息がどんどん口の中に溜ります。両唇は閉鎖している状態を指して「閉鎖音」と呼ばれます。
もうこれ以上、口の中で息を溜められなくなった時に右の図のように開放します。開放する時に、膨らんだ風船に針を刺すと破裂するように息を吐き出す様子から「破裂音」とも呼ばれます。
/b/は「閉鎖音」とも「破裂音」とも呼ばれますが
どちらも正しい呼び方だとわかりましたね?
/b/は上と下の唇を閉じて開放する直前まで口の中の気圧が高まりますので両唇と、口の中の筋肉を使います。開放する瞬間は両唇の筋肉を使います。
日本語の「バ行」の吐く息よりも英語の/b/の方が吐く息に勢いがあります。
/b/も/v/と同じ「有声音」
口の形がわかったら、次に有声音か無声音かを確認しましょう。/b/も/v/と同じく声帯の振動がある「有声音」です。
/b/の口の形を作り、同時にしっかりと声を出しましょう。/b/の音は曖昧な「バッ」のように聴こえます。
有声音とは声帯を振動させて出す「声が出る音」・無声音とは声帯を振動させない「息だけの音」です。
/b/と/v/の口の形を比較する
ここまでは/v/と/b/、それぞれの口の形と声の出し方を詳しくみてきましたが、ここからは2つの音素の比較です。以下の画像を見比べて、違いをしっかりと脳内に焼き付けましょう。
左が/v/、右が/b/の画像です。/b/は2種類の動きのうちの1つ目「閉鎖」を採用しました。/v/と/b/の違いがハッキリしましたか?
音声認識ソフトで3回「vote」と文字化できれば合格
音素単位で/r/と/l/の口の形や音の出し方が理解できましたので、次は実践をしてみましょう。
「vote」と3回発音してみて、3回とも「vote」と文字になるかどうか試してみましょう。安定的に3回とも「vote」が文字化されたら合格です! もし、1回でも間違えたらたら上記に戻って/v/の口の形をできるまで復習してくださいね。
スペル | 発音記号 | 意味 |
vote | /voʊt/ | 投票 |
仕上げに自分の音声をネイティブの音声に近づける練習をする
上記で3回 「vote」と音声認識されたとしても、もうひと頑張りしてください。
その理由は、音声認識の合格ラインは100点満点中の70点レベルだからです。もしギリギリ70点だとしたら実際の会話では通じない可能性があります。
どんな試験でも同じですよね? 例えば70点以上で合格のばあい、70点前後では「不合格になる要素を排除できていない」ということです。
そのような不安要素を取り除くためにも、Cambridge Dictionaryを使って、ネイティブの音声で「vote」の発音をよく聴いて、自分の発音をできるだけネイティブの音声に近づける練習が欠かせません。
もし「何かが違うな」と思ったらもう一度、適切に口の形を作ってネイティブの音に近づける練習しましょう。この努力が「最後の仕上げ」です。
せめて80点以上にレベルアップしておけば、実際の会話で”Excuse me? Can you say it again?” と聴き返されることが少なくなりますよ!