# AI音声技術

スマートの新型電動SUV『#5』、ゼンハイザーのプレミアムオーディオ搭載へ
2024.08.28

スマートの新型電動SUV『#5』、ゼンハイザーのプレミアムオーディオ搭載へ

スマートは8月23日、ドイツの音響ソリューション企業のゼンハイザーと戦略的パートナーシップを締結した、と発表した。この提携により、スマートの新型電動SUV『スマート#5』の一部モデルには、ゼンハイザー製のサウンドシステムが搭載される予定だ。スマートとゼンハイザーは、ヨーロッパ発の

Shure、ボーカルから大音量の楽器まで対応するレコーディングマイク
2024.08.22

Shure、ボーカルから大音量の楽器まで対応するレコーディングマイク

Shureはボーカルから幅位広い楽器で使用できるレコーディングコンデンサーマイク「SM4」を8月28日に発売する。予想実売価格は3万6630円前後。 Shureはミックスに適したサウンドを実現するコンデンサーマイク「SM4-K-J」を8月28日に発売する。予想実売価格は3万663

“超高速”な日本語音声生成モデル、東大発ベンチャーのNABLASが開発
2024.08.14

“超高速”な日本語音声生成モデル、東大発ベンチャーのNABLASが開発

 東大発スタートアップのNABLAS(株)は8月13日、米Googleの音声生成モデル「SoundStorm」をベースとした日本語音声生成モデルを開発したと発表した。本モデルは、数秒のデータを用いて瞬時に日本語の音声生成が可能。同社独自の日本語データセットを用いてモデルの学習を行ない、自然な日

Google Geminiにも音声会話機能、GPT-4oの高度な音声モードに対抗する「Gemini Live」
2024.08.14

Google Geminiにも音声会話機能、GPT-4oの高度な音声モードに対抗する「Gemini Live」

 米Googleは8月13日(現地時間)、同社の生成AI「Gemini」モバイル版において、音声会話機能「Gemini Live」をリリースすると発表した。Androidの「Gemini Advanced」プラン(月額2,900円、初月無料)加入者向けに、同日より英語での提供を開始し、今後数週

東大発ベンチャー、超高速「日本語音声生成モデル」を開発 グーグルのSoundStormをベースに
2024.08.13

東大発ベンチャー、超高速「日本語音声生成モデル」を開発 グーグルのSoundStormをベースに

NABLASは8月13日、グーグルが開発した音声生成モデル「SoundStorm」の構造をベースに、数秒のデータを用いて瞬時に日本語の音声生成が可能な「日本語対応音声生成モデル」を開発したことを発表した 東大発ベンチャーのNABLASは8月13日、グーグルが開発した音声生成モデル

スカーレット・ヨハンソンはNG。ChatGPTの新音声モードはどんな声?
2024.08.05

スカーレット・ヨハンソンはNG。ChatGPTの新音声モードはどんな声?

さてどんな声で来るのか!?ChatGPTが音声でのサービスを開始したとき、その声の1つが映画『her/世界でひとつの彼女』のスカーレット・ヨハンソンそっくりじゃん!と話題になり、本人からも抗議を受け、一旦サービス停止になったのは記憶に新しいところ。Phone Are

NTTのヘッドホン「nwm ONE」レビュー:耳をふさがず音漏れしにくくなる技術の実力は?
2024.07.31

NTTのヘッドホン「nwm ONE」レビュー:耳をふさがず音漏れしにくくなる技術の実力は?

NTTグループ内の音響関連の事業会社・NTTソノリティは、自社のブランドである「nwm(ヌーム)」から耳をふさがないワイヤレスヘッドホン「nwm ONE(ヌーム ワン)」を発売した。アマゾンや楽天の直営ストア、家電量販店でも7月18日から販売中。直販価格は3万9600円(税込)。

OpenAI、ChatGPTが感情も読むアドバンスト音声モードを招待制テスト開始『Her』スカヨハ似ボイスは含まず
2024.07.31

OpenAI、ChatGPTが感情も読むアドバンスト音声モードを招待制テスト開始『Her』スカヨハ似ボイスは含まず

OpenAIが、ChatGPTの延期していた新機能 Advanced Voice Mode を一部Plusユーザー向けに試験提供しました。Advanced Voice Mode は、ChatGPTと音声で自然な会話ができる機能。ChatGPT は従来から音声モードに

AI音声のリーディング企業Supertoneが日本市場進出 革新的音声変換技術が切り開く、”コンテンツ市場の未来”
2024.07.22

AI音声のリーディング企業Supertoneが日本市場進出 革新的音声変換技術が切り開く、”コンテンツ市場の未来”

 2024年7月3日~5日にかけて、東京ビッグサイトで開催された『第15回 コンテンツ東京』。日本最大規模を誇るこのコンテンツ総合展示会に、日本市場に初進出となる韓国のAIオーディオ企業・Supertone(スーパートーン)が初出展した。 Supertoneは、2020年に設立さ

AIに学ばせる音声データを認証する団体設立へ 声優ら対価支払い
2024.06.25

AIに学ばせる音声データを認証する団体設立へ 声優ら対価支払い

 AI(人工知能)に学ばせる音声データを認証する団体が来月にも設立される。25日に会見した団体によると、国内初だという。AI開発者は、認証を受けた質の高い安全なデータを購入することができ、声優らにも対価が支払われるようになる。データの追跡や透明性の確保につながるため、AI開発と知的財産の保護と

グーグル、AI生成動画に合わせて音声やBGMを作る技術を発表
2024.06.20

グーグル、AI生成動画に合わせて音声やBGMを作る技術を発表

Google DeepMindは6月17日、動画のピクセルデータから音声を自動生成する技術「Video-to-Audio(V2A)」を発表した。この技術により無音の生成AI動画に自然な音声、音楽、効果音、セリフを追加することが可能になる。 Google DeepMindは6月17

「AirPods Proの“会話を検知”だけじゃ不十分」──ワシントン大学が凝視するだけで相手の声を抽出する新技術
2024.06.16

「AirPods Proの“会話を検知”だけじゃ不十分」──ワシントン大学が凝視するだけで相手の声を抽出する新技術

AirPods Proの会話検知は、いつ会話検知機能が起動するのかをほとんど制御できない。 アップルは先日開催した“WWDC24”で、AirPods Proの通話品質をより明瞭にするために「声を分離」機能が追加すると発表した。この機能により、騒々しい場所や風が強い場所でも話し手の

HiBy、メカニカルな筐体デザインのミドルクラスDAP「R4」。本体上部にストラップも装備
2024.06.14

HiBy、メカニカルな筐体デザインのミドルクラスDAP「R4」。本体上部にストラップも装備

ミックスウェーブは、同社取り扱いブランドHiBy Musicから、ミドルクラスDAP「R4」を6月28日より発売する。価格はオープンだが、税込45,800円前後での実売が予想される。カラーバリエーションはBlack/Silver/Green/Orangeの4色を用意する。R4は、

【独占】グーグルの「Pixel」カメラ用ラボを見学(後編)--微調整の努力に感嘆
2024.05.28

【独占】グーグルの「Pixel」カメラ用ラボを見学(後編)--微調整の努力に感嘆

 前編に続いて、Googleが「Pixel」のカメラをテストするために使用しているラボの取材レポートをお届けする。オートフォーカス、露出、グリース スマートフォンのカメラの内部でグリースが使われていることをご存じだろうか。カメラのレンズは、オートフォーカスのために前

「Google Meet」に同じ空間での会議参加時にありがちなハウリングなど防ぐ機能が追加
2024.05.24

「Google Meet」に同じ空間での会議参加時にありがちなハウリングなど防ぐ機能が追加

 米Googleは5月22日(現地時間、以下同)、オンラインビデオ会議サービス「Google Meet」にアダプティブオーディオ(適応型オーディオ)機能を追加したことを発表した。 適応型オーディオ機能を使えば同じ室内にいる会議の参加者同士の音声のハウリングやエコーなどを防げる。室

米スター俳優が「ChatGPT」に猛烈抗議。それをうけ、同社は一部機能を
2024.05.23

米スター俳優が「ChatGPT」に猛烈抗議。それをうけ、同社は一部機能を"停止"か

人工知能(AI)の開発を行うオープンAI(OpenAI)が公開したチャットボット「ChatGPT」の最新版の音声アシスタント「スカイ」の声について、自身の声に「酷似している」と非難しているスカーレット・ヨハンソンが、同社に対して法的措置を取る可能性もあることが明らかになった。「ス

チャットGPT、音声を一部削除 米俳優ジョハンソン氏の声に似ているとユーザーら指摘
2024.05.22

チャットGPT、音声を一部削除 米俳優ジョハンソン氏の声に似ているとユーザーら指摘

米オープンAIはこのほど、生成AI(人工知能)のチャットGPTから、ハリウッド俳優のスカーレット・ジョハンソン氏に似ていると指摘された音声を削除すると発表した。オープンAIは先に、チャットGPTの新しい読み上げ機能「スカイ」を発表。しかしユーザーから、読み上げ音声がジョハンソン氏

マイクロソフト、「Azure AI Speech」のアップグレードを発表
2024.05.22

マイクロソフト、「Azure AI Speech」のアップグレードを発表

 Microsoftは米国時間5月21日、年次開発者会議「Microsoft Build」で、「Azure AI Speech」サービスの新機能を発表した。これらの新機能は、音声に対応した生成人工知能(AI)アプリの開発を強化するものだ。 MicrosoftのリリースではAzur

OpenAI、スカーレット・ヨハンソン似のChatGPT音声は「模倣でない」とコメント 一時使用停止に ヨハンソンはOpenAIからの依頼を断っていたことを明かす
2024.05.21

OpenAI、スカーレット・ヨハンソン似のChatGPT音声は「模倣でない」とコメント 一時使用停止に ヨハンソンはOpenAIからの依頼を断っていたことを明かす

 OpenAIは、ChatGPTの音声機能で使っている声の1つがスカーレット・ヨハンソンさんの声に似ているとの指摘を受け、模倣してはいないと説明しました。当該の音声は使用を一時停止するとしています。 OpenAIでは2023年9月に立ち上げ音声機能で、Breeze、Cove、Em

ChatGPTのSkyはスカーレット・ヨハンソンの声ではない。OpenAIが声明
2024.05.20

ChatGPTのSkyはスカーレット・ヨハンソンの声ではない。OpenAIが声明

 OpenAIは19日、AIチャットボット「ChatGPT」のボイスの選定に関する情報を公開。その中で、ChatGPT上で選べるボイス「Sky」について、俳優スカーレット・ヨハンソン氏の声ではなく、別の俳優によるものであると説明した。 ChatGPTでは現在、音声読み上げをする際