AIとテキスト読み上げ技術が変える未来 声優のしごと

AIとテキスト読み上げ技術が変える未来 声優のしごと

テキスト読み上げ技術とは、文字情報を音声に変換して読み上げる技術です。テキスト読み上げ技術の現状と課題について、以下のようにまとめられます。

テキスト読み上げ技術の現状

  • テキスト読み上げ技術は、ビジネスや教育、エンターテイメントなど、さまざまな分野で活用されています。
  • テキスト読み上げ技術は、音声合成と音声認識の二つの技術に分けられます。音声合成は、テキストを音声に変換する技術で、音声認識は、音声をテキストに変換する技術です。
  • 音声合成技術は、人間の声に近い自然な音声を生成することができるようになっています。また、多言語や方言、有名人の声など、さまざまな音声を選択できるサービスもあります。
  • 音声認識技術は、音声をテキストに変換するだけでなく、音声を理解して適切な応答や操作を行うことができるようになっています。例えば、スマートスピーカーやスマートフォンなどの音声アシスタントは、音声認識技術を利用しています。

テキスト読み上げ技術の課題

  • テキスト読み上げ技術には、まだ改善の余地がある点が多くあります。
  • 音声合成技術においては、音声の感情やニュアンス、話し方などを表現することが難しいという課題があります。また、音声の品質や自然さにも差があります。
  • 音声認識技術においては、音声の聞き取りや理解に失敗することがあるという課題があります。例えば、雑音や方言、同時発話などが音声認識の精度を低下させます。また、音声の意図や文脈を正しく把握することが難しい場合もあります。
  • テキスト読み上げ技術の普及には、社会的な課題もあります。例えば、音声認識技術の利用によるプライバシーやセキュリティの問題や、音声合成技術の悪用や偽造の問題などが挙げられます。

AIによる音声生成技術

初音ミク

音声合成技術を用いて、人間の声に近い自然な歌声を生成するキャラクター

Spotify

音声認識技術を用いて、ポッドキャストの翻訳機能を提供するサービス。また、「spotifyは自動選曲技術 by Spotify」としてユーザーの声や周囲の音を収集・分析し、そのデータをもとに状況に合った音楽を提案する技術を発表しており、プライバシーやその他の人権を侵害との批判をうけている。

ChatGPT

音声認識技術と音声合成技術を用いて、AIと声で会話できるサービスを開始(音声入力はアプリ版もしくはChoromeの拡張機能を使用し、その入力に対し、回答生成と音声出力を行う)

AIによる音声生成技術は声優の仕事を奪うのか

AIによる音声生成技術の発展により、声優の仕事がAIに奪われることが懸念されるとのニュースがありました。

また、声優に限らず、俳優によるAI技術の発展による職の縮小へのストライキがハリウッドで行われ、話題となりました。

声優の仕事は、高度かつ専門的なスキルが必要ですが、AIによる音声生成技術は、人間の声の品質や自然さ、多様性や感情を再現可能になりつつあります。声優の仕事は、外国映画やアニメの吹き替え、ゲームやアニメのキャラクターの声、ナレーションやアナウンス、ポッドキャストやラジオドラマなど、さまざまな分野に及びます。

これらの分野の一部は、AIによる音声生成技術によって代替される可能性があります。現在音声AIによるニュース記事の読み上げなどが施工されています。

しかし、声優の仕事は、完全にAIによる音声生成技術に取って代わられることはないと考えられます。声優の仕事には、AIによる音声生成技術にはまだ足りないものがあります。例えば、以下のようなものがあります。

  • 音声の感情やニュアンス、話し方などを表現することが難しい
  • 音声の権利や著作権の問題が発生する可能性がある
  • 音声の悪用や偽造の問題が発生する可能性がある
  • 文化的なニュアンスを伝えることが難しい
  • 声優自身の個性や魅力を発揮することが難しい

故人の音声を生成

AIの音声生成技術は、声優の仕事を奪うという懸念の一方で、故人の演技を現代に再生できる可能性があります。これは、歴史的な音声の復元と保存に貢献することができます。

AIの音声生成技術で個人の演技を再生できるのか?

過去に、ドラえもんの声優交代の際に、AIの可能性を示唆されたとの記事が上がりました。(こちら

今後AIの技術発展によっては代わりの声優の仕様より、AIによる合成音声を求められるケースが増えることは容易に想像ができます。

技術の発展に伴う問題は現在すでに存在しており、もの問題の解決方法が注目されます。