今回は、AIの技術を使い、英語の発音をネイティブに近い発音に変換するという話。

 

NTTが開発しました。

 

下記で書くように、この技術は現時点でちょっと謎めいている面もありますが、このようなAIが登場することで、国際会議での応用などができるかもしれないと、期待がかかります。

 

 

NTTがAIの技術を使い、日本人の英語をネーティブに近い発音に変換する技術を開発、将来的には日本人だけでなく、様々な国や地域の人が参加する会議などに利用できるか

7日の日経新聞によると、NTTは日本人の英語をネーティブに近い発音に変換する技術を開発したとのこと。人工知能(AI)の技術を使い、人間らしい音声に合成できるようにしたとのこと。

 

英語の発音が苦手な日本人でも、円滑なコミュニケーションを取りやすくなるとのこと。1、2年後の実用化が目標とのこと。

 

新技術で日本人以外が話す英語もネーティブに近い発音に変換できれば、様々な国や地域の人が参加する会議などに利用できるとのこと。今後は変換処理を高速にする改良などをするとのこと。

 

 

  • NTTは日本人の英語をネーティブに近い発音に変換する技術を開発した

  • 人工知能(AI)の技術を使い、人間らしい音声に合成できるようにした

  • 英語の発音が苦手な日本人でも、円滑なコミュニケーションを取りやすくなる

  • 1、2年後の実用化が目標

  • 新技術で日本人以外が話す英語もネーティブに近い発音に変換できれば、様々な国や地域の人が参加する会議などに利用できる

  • 今後は変換処理を高速にする改良などをする

 

 

NTTのAIを使って英語発音ネイティブ変換技術、そもそもネイティブとはいったいどこの国を指しているのか?このような技術が開発されていくことで、国際会議などでは役に立つ時代が来る。ただ、日常生活では短期的にはまだ期待しない方がいい。

AIの技術で英語発音をネイティブに変換してくれる。

 

なんとも便利な話です。

 

ただ、まず今回の技術で疑問点。

 

ネイティブといっていますが、そもそもいったいどのネイティブの話をしているのでしょうか。

 

英語が母国語の国ってのはけっこうあるわけで、そう考えると、本来、やはりいくつかバリエーションがあるべきといえます。

 

要は、例えば、アメリカンイングリッシュだろうと、ブリティッシュイングリッシュだろうと、聞きたい人に合わせるべきといえます。つまり、どのネイティブの発音か、アウトプットの部分を選べるようにしておく必要があります。

 

さて、英語学習者の方。

 

このような技術が登場することで、英語の発音は軽視していいかどうかについて。

 

 

確かに、英語の発音はけっこうやっかいな勉強領域であります。

 

私なんかも、ジャパニーズイングリッシュを話してもアメリカで全然通じなかったため、必死こいてアメリカンイングリッシュを習得するためにかなりの時間と金を費やしています。気持ちは分かります。

 

ただ、このような技術が登場したからといって、すぐ日常生活で応用でき、劇的に変わるような話にはまずならないと思われます。

 

 

そもそも、そのような変換器(スマホに埋め込まれたと仮定して)を持って友達とカフェやバーで会話すると考えてみてください。変換器(スマホ)を介して会話するという違和感があるのは当然として、変換器(スマホ)がないと英語でのコミュニケーションが成り立たないのかと認識されてしまいますし、現時点ではありえない話でしょう。

 

もちろん、将来的には、技術発展が進み、自然な形でコミュニケーションできるようになるのかもしれませんが、そんな将来のことを現在期待していても仕方がないというもの。

 

よって、日常生活での期待はあまり膨らませない方がいい、すなわち、発音は軽視しすぎず、きちんとコミュニケーションできるレベルまではやっておいた方がいい、といったあたりの結論になります。

 

ただ、このような技術は、国際会議などでは将来的に活躍してくれる可能性はあるといえます。

 

ある国の人が話す英語は何度聞いても分からない。こんな経験がある方もいるでしょう。やはり、各国クセがありますから、会議のような重要な場でミスコミュニケーションが起こらないようにするため、このような変換技術は有用な可能性があります。

 

最後に、NTTがどのようにこの技術を開発させたのか、ここを確認しておきましょう。

 

 

AIがネイティブの英語発音に変換、NTTはどのようにこの技術を開発させたのか。

上記日経新聞によると、同じ英文を日本人と、母語とする人のそれぞれに話してもらい、そのデータから発音の違いをAIの一種である「機械学習」で学習させたとのこと。携帯電話の通話に使われる信号処理を発展させた技術と組み合わせ、日本人が発した英語をネーティブのような発音に変換して音声を合成するとのこと。

 

さらにAIの最新技術「敵対的生成ネットワーク」を利用して音声を加工するとのこと。主に画像の生成に使われているが、人間の声の特徴をもとに、肉声のような音声を合成することができるとのこと。人工的な音声はそのままだと聞き取りにくくストレスを感じるケースもあるが、こうした課題を克服できるというとのこと。

 

 

  • 同じ英文を日本人と、母語とする人のそれぞれに話してもらい、そのデータから発音の違いをAIの一種である「機械学習」で学習させた

  • 携帯電話の通話に使われる信号処理を発展させた技術と組み合わせ、日本人が発した英語をネーティブのような発音に変換して音声を合成する

  • さらにAIの最新技術「敵対的生成ネットワーク」を利用して音声を加工する

  • 主に画像の生成に使われているが、人間の声の特徴をもとに、肉声のような音声を合成することができる

  • 人工的な音声はそのままだと聞き取りにくくストレスを感じるケースもあるが、こうした課題を克服できるという

 

敵対的生成ネットワークでよく聞くのは画像の生成です。テキストから画像を生成するといった具合に。

 

でも、音声の合成にもつながる技術ということで、かなり奥が深いと分かります。

 

NTTのネイティブに近い発音に変換する技術の実用化のゆくえは。要注目です。

スポンサーリンク