# 音声処理

マイクの風切り音を消せるAIサービス、お試し無料
21時間前

マイクの風切り音を消せるAIサービス、お試し無料

音声AI関連の事業を手がけるElevenLabsは7月4日、音声データに含まれるバックグラウンドノイズをAIで消去できる「ボイス・アイソレーター」を発表した。 音声AI関連の事業を手がけるElevenLabsは7月4日(現地時間)、音声データに含まれるバックグラウンドノイズをAI

メタが音楽生成AI、メロディー、リズム、コード進行などを元に生成可能
2024.06.24

メタが音楽生成AI、メロディー、リズム、コード進行などを元に生成可能

メタは6月18日、テキストの他にもメロディー、コード(和音)進行、リズムパターンなどの要素をプロンプトとして使用できる音楽生成AIモデル「JASCO(Joint Audio and Symbolic Conditioning)」を発表した。 メタは6月18日、テキストだけでなく、

NTT、声と“話し方”を一瞬で変えるリアルタイム変換技術
2024.06.17

NTT、声と“話し方”を一瞬で変えるリアルタイム変換技術

日本電信電話(NTT)は、ある話者の声を、まるで他の話者が話しているかのように高品質・低遅延に音声変換する技術を考案した。Web会議やライブ配信などでのリアルタイム音声変換が可能で、今後はスマートフォンやVRデバイス上での利用など、さまざまな場面での応用が期待されるとしている。N

NTT、声を好みのスタイルに一瞬で変える「リアルタイム音声変換」技術
2024.06.17

NTT、声を好みのスタイルに一瞬で変える「リアルタイム音声変換」技術

 NTT(持株)は、ある話者の声を、まるで他の話者が話しているかのような声に変換する、高音質と低遅延を両立した「リアルタイム音声変換技術」を開発した。 これにより、Web会議やライブ配信などでのリアルタイム音声変換が可能になり、今後はスマートフォンやVRデバイス上での利用など、さ

GPT-4oの動画・画像、音声の能力は? これから使える機能、今わかっていることまとめ
2024.05.25

GPT-4oの動画・画像、音声の能力は? これから使える機能、今わかっていることまとめ

 OpenAIの新型AIモデル「GPT-4o」で特に注目すべきは、動画理解や音声処理能力です。たとえば45分の専門家向け講義動画をGPT-4oに入力し、数分で正確に要約する能力を示しました。さらに、高品質な画像生成や3Dオブジェクトの生成までこなします。まだ一般開放されていないこれらの技術はど

Nothing、全オーディオ製品へChatGPTを統合 Nothingスマホとペアリングで直接対話が可能に
2024.05.17

Nothing、全オーディオ製品へChatGPTを統合 Nothingスマホとペアリングで直接対話が可能に

活用しやすいリアルタイムAIボイスチェンジャー「Paravo」β版
2024.05.14

活用しやすいリアルタイムAIボイスチェンジャー「Paravo」β版