# 言語処理
Googleドキュメントの「画像からの文字起こし」の実力を「武道館」で試してみた
Googleドキュメントに写真や画像をアップすると、その写真から文字起こしできることをご存じですか? つまり映っている看板などから、そこに映っている文字をテキストに変換できます。そこで、どうしても気になったのが「武道館の看板」を文字起こしできるのか。武道館の看板はかなりの達筆です
ELYZA、「GPT-4」を上回る日本語性能のLLMを開発
ELYZAは大規模言語モデル「ELYZA LLM for JP」シリーズの最新モデルとして、Metaの「Llama 3」をベースとした700億パラメーターの「Llama-3-ELYZA-JP-70B」と80億パラメーターの「Llama-3-ELYZA-JP-8B」を開発し、性能を公開した。
GPTに変化球。ChatGPTのエラーを見つけ出すための新モデル「CriticGPT」、OpenAIが発表
米OpenAIは6月27日(現地時間)、同社が提供する大規模言語モデル(LLM)「GPT-4」をベースとした新AIモデル「CriticGPT」を発表した。LLMの強化学習に利用するGPTモデルとして、現在「ChatGPT」の比較的短い回答を対象にトレーニング中。 「Critic
NTTデータ、大規模言語モデル「tsuzumi」をMicrosoft Azure上で提供、11月以降
株式会社NTTデータは2024年11月以降に、マイクロソフトがWindows Azure上で提供する大規模言語モデルサービス「Model-as-a-Service(MaaS)プラットフォーム」にて、NTTグループの大規模言語モデル「tsuzumi」の提供を開始すると発表した。
NTTデータ、NTT版LLM「tsuzumi」をAzure上でMaaSとしてサービス提供へ
株式会社NTTデータは27日、大規模言語モデルをクラウド上で利用可能とする、Microsoftの「Model-as-a-Service(MaaS)プラットフォーム」上で、NTT版LLM(大規模言語モデル)である「tsuzumi」を提供すると発表した。日本国内向けの提供となり、提供開始は202
OpenAI、GPT-4のエラーを指摘するGPT-4ベースの「CriticGPT」リリース
米OpenAIは6月27日(現地時間)、ChatGPTなどのLLMの出力の誤りを検出するためのGPT-4ベースのモデル「CriticGPT」を発表した。 人間によるAIトレーニングの際に、ChatGPTの回答の誤りを指摘することで、トレーニングの精度向上を支援する。
「Copilot in Excel」がさらにパワーアップ!
米Microsoftは6月24日(現地時間、以下同)、「Copilot in Excel」に新たな能力を追加したことを発表した。 「Copilot in Excel」では、データをもとにしたグラフの作成や分析、表の並べ替え指示などに対応できることが知られている。さらに今回は、よ
NTTデータ、国産LLM「tsuzumi」を「Microsoft Azure」で提供
NTTデータは6月27日、NTTが開発する大規模言語モデル(LLM)「tsuzumi」を「Microsoft Azure」で11月以降に提供すると発表した。「Azure AI Studio」を利用してtsuzumiのチューニングやビジネスアプリケーション開発が可能になるとしている。<
日本に“最適化” 国内最高レベルの生成AI公開
生成AIの中核技術であるLLM=(大規模言語モデル)の開発競争が激化するなか、国内最高レベルの日本語性能を実現した最新モデルが公開されました。 東京大学発のAIスタートアップ「ELYZA」が開発した最新のLLMモデルは、OpenAIの中でも有料で上位タイプのGPT‐4のような生
ELYZA、2つの新たな日本語特化の国産LLMを発表--短期で大幅な性能進化
ELYZA(イライザ)は6月26日、日本語に特化した国産の大規模言語モデル(LLM)「ELYZA LLM for JP」の最新モデルとなる700億パラメーターの「Llama-3-ELYZA-JP-70B」と80億パラメーターの「Llama-3-ELYZA-JP-8B」を発表した。
Anthropicが「Claude 3.5 Sonnet」をリリース ~「Claude 3 Opus」の2倍高速な最新LLM
米Anthropicは6月21日(日本時間)、「Claude 3 Opus」の2倍の速度で動作する大規模言語モデル(LLM)「Claude 3.5 Sonnet」を発表した。Webサイト「claude.ai」とiOSアプリ「Claude」から無料で利用できる。Claude ProやTeamプ
AI検索エンジン「Perplexity」の性能はChatGPT越え? その凄さを解説
2024年5月、ウォール・ストリート・ジャーナルが「ChatGPT」「Copilot」「Gemini」「Claude」「Perplexity」の5種のチャットAIを対象に、日常会話への応答性能を人間が評価するテストを実施しました。その結果、なんとChatGPTなど様々なAIを抑え
日本語の声から「英語のAI音声」を誰でも作成できるツール「Cross-Language TTS」が一般公開。約5分間の収録をするだけで日本語と英語のAI音声が作成され、自由にボイスを出力できる
AI音声プラットフォーム「CoeFont」を提供するCoeFontは6月13日、日本語で音声収録をすると日本語と英語のAI音声が作成可能な新機能「Cross-Language TTS」を無料で一般公開した。今後は中国語、フランス語、スペイン語にも順次対応していく予定とのこと。
乗換案内に「AI音声入力」を導入 「今日、渋谷に夕方5時」で経路検索
経路検索アプリ「乗換案内」を提供するジョルダンは、6月11日に「AI音声入力 乗換案内」について発表した。 これまで、乗換案内の音声入力は出発地と目的地の入力に対応していた。5月20日から順次提供していたAI音声入力 乗換案内では「今日、渋谷に夕方5時!」「明日10時に東京から
iPhoneに独自生成AI搭載、メールを要約し返信内容も作成…今秋から英語で無料提供
【ニューヨーク=小林泰裕】米IT大手アップルは10日、独自開発した生成AI(人工知能)機能を、主力スマートフォン「iPhone(アイフォーン)」などに搭載すると発表した。まず英語に対応し、今秋から無料で提供する。オープンAIの対話型AIサービス「チャットGPT」とも連携し、AIサービスで先行
自分だけの信頼できるAIへ グーグル「NotebookLM」公開
Googleは6日、手持ちの情報だけで使える生成AIサービス「NotebookLM」について、日本語含む200以上の国や地域への対応と機能強化を発表した。現在は「試験的な提供」と位置付けられており、無料で利用できる。NotebookLMは、2023年のGoogle I/Oで「Pr
Macで文章入力の手間を省くなら「TRex」
macOSの素晴らしい機能の1つは、テキスト認識表示(Live Text)です。Mac上の画像からテキストを抽出できる機能です。しかし、画像にしか適応できず、動画やそのほかの資料には未対応。この回避策として、Mac用の無料アプリケーション、TRexが登場しました。ま
リコー、指示追従性能や要約性能を向上した130億パラメーターの日本語LLMを開発
株式会社リコーは3日、国立研究開発法人理化学研究所 革新知能統合研究センター 言語情報アクセス技術チーム(以下、理研 AIP)との共同開発で得られたインストラクションデータを、リコー製130億パラメーターの日本語LLMに追加学習させ、LLMの指示追従性能(ユーザーの指示や質問に対して自然な回
ChatGPT、無料ユーザーも「GPT-4o」を利用可能に
OpenAIは、ChatGPTの無料ユーザー(ChatGPT Free)向けに最新モデルである「GPT-4o」の機能を提供開始した。無料ユーザーでも、ブラウズ、Vision(ビジョン)、データ分析、ファイルのアップロード、GPTsの各機能を利用可能になる。All C
IBM、東南アジア向けLLMのテストでシンガポールと提携
IBMは、AI Singapore(AISG)の開発した東南アジア向け大規模言語モデル(LLM)をテストし、カスタマイズした人工知能(AI)アプリケーションを開発者が構築できるようにする取り組みで、AISGと合意した。 この提携に基づき、IBMは自社のAIテクノロジーおよびデー