# マルチモーダル

100万トークンのコンテキストウィンドウ、グーグル「Gemini1.5 Flash」 その実力とは?
2024.07.07

100万トークンのコンテキストウィンドウ、グーグル「Gemini1.5 Flash」 その実力とは?

グーグルが毎年恒例の開発者会議で、高速で狭い範囲の高頻度タスクに特化したマルチモーダルLLMモデル「Gemini 1.5 Flash」を発表した。GoogleのAI部門の最大の競合といえばチャットGPTを開発しているOpenAIだが、OpenAIが同社の最新AIモデル「GPT-4

NICTとKDDI、ハルシネーションを抑えたLLMを共同研究
2024.07.03

NICTとKDDI、ハルシネーションを抑えたLLMを共同研究

 情報通信研究機構(NICT)とKDDIは7月1日、高性能な大規模言語モデル(LLM)を開発する共同研究を始めると発表した。NICTが蓄積してきたWebページなどの膨大なデータと、KDDIが開発してきたハルシネーション抑制技術などを組み合わせる。 LLMでは、AIが事実と異なる情

自動運転ベンチャーTuringが15億円を追加調達 累計60億円に 計算基盤の整備に活用
2024.07.01

自動運転ベンチャーTuringが15億円を追加調達 累計60億円に 計算基盤の整備に活用

 自動運転ベンチャーのTuring(東京都品川区)は7月1日、約15億円を調達したと発表した。これにより、同社の調達総額は約60億円になった。4月の調達と同様、資金は大規模計算基盤の整備や、人間の介入なしに都内を30分走行できる自動運転システムの構築などに充てる。 今回の資金はエ

KDDIとNICT、通信品質改善に活用できるLLM
2024.07.01

KDDIとNICT、通信品質改善に活用できるLLM

KDDIと情報通信研究機構(NICT)は1日、大規模言語モデル(LLM)に関する共同研究を開始した。LLMの課題となるハルシネーション(事実と異なる内容の生成)を抑制するほか、地図画像や建物情報などのマルチモーダルデータの取り扱いを可能とする技術を開発する。NICTが蓄積している

生成AI画像とLLMの熱い関係?LLMを併用するいろいろな生成AI画像環境のご紹介
2024.06.20

生成AI画像とLLMの熱い関係?LLMを併用するいろいろな生成AI画像環境のご紹介

 1年前の2023年6月、画像生成AIである「Stable Diffusion」はまだバージョン1.5。LLM(大規模言語モデル)は「GPT-4」などが既にあったものの、この時点では各々独立して動いており、同じAIと言ってもあまり関係がなかった。 ところがSDXLなど生成AI画像

動画生成AIの進化が止まらない 今度は「Runway」の動画が超高品質に
2024.06.18

動画生成AIの進化が止まらない 今度は「Runway」の動画が超高品質に

Runwayは6月17日、高品質で詳細な制御が可能な次世代の動画生成モデル「Gen-3 Alpha」を発表、今後数日以内に利用可能になるという 動画生成サービスを展開するRunwayは6月17日、高品質で詳細な制御が可能な次世代の動画生成モデル「Gen-3 Alpha」を発表した

OpenAIがドイツの技術イベントで語った「生成AIの次」に起きること。加速する4つの変化とは
2024.06.12

OpenAIがドイツの技術イベントで語った「生成AIの次」に起きること。加速する4つの変化とは

「この1年で、この業界は大きく変わりました」生成AIブームの火付け役とも言える米OpenAIでチーフアーキテクトを務めるコリン・ジャーヴィス氏は力強くこう語る。OpenAIが開発するChatGPTや、グーグルのGemini、マイクロソフトのCopilotをはじめ、各

「言葉に込められた感情」もアウトプット。Chat GPT-4oの出現で、AI環境はどう変化する?
2024.06.11

「言葉に込められた感情」もアウトプット。Chat GPT-4oの出現で、AI環境はどう変化する?

『NexTech Week2024【春】』のセミナー企画「Chat GPTが大幅アップデート! GPT-4oの最新情報を徹底解説」が5月23日に東京ビッグサイト西展示棟 特別講演会場で開催された。同セミナーには、石川陽太(ChatGPT研究所 代表)が登壇。モデレーターの小澤健祐

顔パスでバスに乗る…顔認証乗車システムが「ユーカリPASS」本格始動 6月15日
2024.06.09

顔パスでバスに乗る…顔認証乗車システムが「ユーカリPASS」本格始動 6月15日

顔認証をチケットに代えてバスなどに乗車できるシステム「ユーカリPASS」が6月15日より、千葉県佐倉市のユーカリが丘において本格始動する。日本で初めての本格的な顔認証乗車システムだ。新交通システム山万ユーカリが丘線とコミュニティバス(こあらバス)で利用可能だ。ユーカリが丘は、19

22人の小規模チームがGPT-4クラスのモデル開発に成功 新興AI企業Rekaの最新モデルの実力とは?
2024.06.02

22人の小規模チームがGPT-4クラスのモデル開発に成功 新興AI企業Rekaの最新モデルの実力とは?

OpenAIやAnthropicといった大手だけでなく、新興のAIスタートアップ、Rekaが業界の注目を集めている。2024年4月15日の最新報道によると、同社は22人の小規模チームで、GPT-4クラスのマルチモーダル言語モデル「RekaCore」を開発した。Rekaは、ディープ

「登山はこの靴でいいかな?」に答えてくれるAI。買い物に悩んだら頼りたい #MicrosoftBuild
2024.05.22

「登山はこの靴でいいかな?」に答えてくれるAI。買い物に悩んだら頼りたい #MicrosoftBuild

Microsoft(マイクロソフト)が開催したイベント、「Build」をオンライン視聴しました。開発者向けの高度な話が続くなか、自分が使っている未来を想像してワクワクしたのは「マルチモーダルAI」というもの。声と映像で、ビデオ通話をしているかのように買い物の助言をしてくれるんです

Google、マルチモーダルなAIアシスタント「Project Astra」デモでARメガネをチラ見せ
2024.05.15

Google、マルチモーダルなAIアシスタント「Project Astra」デモでARメガネをチラ見せ

グーグル、Gemini時代に突入 Google I/Oで新モデルやエージェントを披露
2024.05.15

グーグル、Gemini時代に突入 Google I/Oで新モデルやエージェントを披露

人間に近づいた「GPT-4o」3つの進化のポイント、徐々に広がりつつある「擬人化」のトレンド
2024.05.15

人間に近づいた「GPT-4o」3つの進化のポイント、徐々に広がりつつある「擬人化」のトレンド

OpenAIの「GPT-4o」はまるで「目を手に入れたAI」。ChatGPT無料版でも利用可能に
2024.05.14

OpenAIの「GPT-4o」はまるで「目を手に入れたAI」。ChatGPT無料版でも利用可能に

グーグル、映像を見せて「Gemini」と会話するAI機能を予告--Google I/O前日に
2024.05.14

グーグル、映像を見せて「Gemini」と会話するAI機能を予告--Google I/O前日に

「GPT-4o」はなんて読む? 女性の声はスカーレット・ヨハンソン(her)似?
2024.05.14

「GPT-4o」はなんて読む? 女性の声はスカーレット・ヨハンソン(her)似?

AIガジェット「rabbit r1」を使ってみた--よかった点と残念だった点
2024.05.11

AIガジェット「rabbit r1」を使ってみた--よかった点と残念だった点

富士通、「がんのタイプ分け」などゲノム医療分野の課題を解く説明可能なAI技術を開発
2024.05.10

富士通、「がんのタイプ分け」などゲノム医療分野の課題を解く説明可能なAI技術を開発

生成AIでゲーム開発効率30%アップも、中国版Sora「生数科技」が数十億円以上の資金調達
2024.05.10

生成AIでゲーム開発効率30%アップも、中国版Sora「生数科技」が数十億円以上の資金調達