AI(人工知能)

AI(人工知能)

アマゾンがAWSで利用可能なビジネス向けに特化した生成AI「Amazon Q」を発表:家庭向けにはアレクサに生成AI機能搭載

Amazon QとはAmazon Qは、ビジネス向けの革新的なAIアシスタントです。企業のデータや情報、コード、システムに接続し、ビジネスユーザーが会話を行い、問題を解決し、コンテンツを生成し、アクションを実行できます。このAIは、ユーザー...
AI(人工知能)

コンピュータ自動操作の未来:GPT-4vを用いたマウスクリック位置予測の精度向上を目指す『Self-Operating Computer Framework』

コンピュータ自動操作の最前線コンピュータの自動操作は、技術の進歩に伴い、ますます現実のものとなっています。その最前線には、GPT-4vを利用した『Self-Operating Computer Framework』があります。このフレームワ...
AI(人工知能)

日本の大企業による生成AI活用事例:取得拡張生成(RAG)を活用して社内データと連携、精算や商談をサポート

はじめに最近の企業におけるAI技術の進化は目覚ましく、特に「取得拡張生成(Retrieval-Augmented Generation, RAG)」のような新技術が注目を集めています。これは、社内データを生成AIが参照することで、AIの応用...
AI(人工知能)

語学学習アプリ世界最大手デュオリンゴ:GPT-4を活用したAI講師を実装

デュオリンゴの新機能語学学習アプリのデュオリンゴは、クイズ形式の学習コンテンツで5億人以上のユーザーを魅了してきました。そのデュオリンゴが、最近のAI技術の進化を取り入れ、ユーザーとのインタラクションを一歩進める新しい機能を導入しました。G...
AI(人工知能)

開発者向け検索エンジンPhindの進化:開発者向けAIがGPT-4のコーディングを凌駕

Phindのリブランドと新世代モデルの登場開発者向けの検索エンジンPhindは、OpenAIのGPT-4のコーディング能力を超えると評価されています。Phindは、もともとHello Cognitionという名前で知られ、2023年3月にP...
AI(人工知能)

Amazonが発表した「AI Ready」プログラム

2025年までに200万人に無料のAIスキルトレーニングを開始Amazonは、AIスキルトレーニングプログラム「AI Ready」の開始を発表しました。このプログラムは、2025年までに世界中で200万人に無料のAIスキルトレーニングを提供...
AI(人工知能)

P3SUMの開発:ニュース要約の忠実性を高める新技術

従来のニュース要約システムの問題点ニュース要約システムに関する重要な進展がありました。アレン人工知能研究所やカーネギーメロン大学などの研究者たちによると、従来のニュース要約システムは、多くの場合で記事の本来の政治的意見や立場を変えてしまう傾...
AI(人工知能)

東京工業大学と富士通がスーパーコンピュータ「富岳」を使用し2023年度に和製AI開発へ

日本独自の生成AI開発計画開発計画の概要東京工業大学と富士通は、2023年5月22日に、スーパーコンピュータ「富岳」を利用した日本独自の生成AIの開発を2023年度内に行うと発表しました。このプロジェクトでは、主に日本語処理を目的とした基盤...
AI(人工知能)

生成AIのパラドックス:驚異の能力と理解力の欠如

生成AIのパラドックス:3つのポイントこの仮説は以下の三つのコアポイントに基づいています。人間とAIの知能の構造には根本的な違いがある。AIの性能は、その訓練目標や入力データの性質に強く依存している。AIの能力の範囲は、人間のそれとは大きく...
AI(人工知能)

「Adobe MAX 2023」で発表された生成AIモデル:生成AIがクリエイターのワークフローに組み込まれる未来

Adobe MAX 2023において、Adobeはクリエイティブ業界を一新する可能性を秘めた、革新的な生成AIモデルを発表しました。これらのモデルは、クリエイターの日々のワークフローに深く組み込まれ、アイデア創出からコンテンツ制作までのプロ...
AI(人工知能)

LLaVA-Plus:多様なツールを活用するマルチモーダルエージェントの学習

LLaVA-Plusの概要とその機能LLaVA-Plusは、大規模なマルチモーダルモデルの能力を拡張する汎用マルチモーダルアシスタントです。このシステムは、事前にトレーニングされた視覚および視覚言語モデルのスキルリポジトリを維持し、ユーザー...
AI(人工知能)

Video2Music: 新時代の音楽生成フレームワーク

動画から音楽を生成する技術は、ついに『Video2Music』の登場で大きな進化を遂げました。膨大な学習データを活用し、作品の特徴に合ったオーディオを生成するこのツールは、革新的なマルチモーダルのトランスフォーマーアーキテクチャを採用してい...
AI(人工知能)

AI技術で未来のスマートフォンを置き換える?Humane Incが「Ai Pin」をローンチ:月額24ドルでデータ通信と電話を無制限で利用可能

マグネットで衣服に取り付けるだけでスマホを代替Humane Incが新しいAIハードウェアデバイス「Ai Pin」を発表し、スマートフォンの代わりを目指しています。元Appleチームが立ち上げたこのスタートアップは、マグネットで衣服に取り付...
AI(人工知能)

ポケトークが同時通訳並みの速さで会話を翻訳するネットサービスを月額3300円で提供:無料の「Google翻訳」「Microsoft翻訳」「DeepL」に能力の高さで挑む

ポケトークの新サービス概要ポケトークが展開するAI通訳サービスは、まもなくスタート予定です。タブレットやスマートフォンで利用可能で、会話の流れを止めることなく、テンポ良く翻訳を表示します。これまでの通訳方式と異なり、会話の途中でさえも翻訳を...
AI(人工知能)

MiniSeekがSQL生成で驚異の精度91.2%を実現

ある機械学習モデルが、SQL生成タスクにおいて90%という精度の壁を破る快挙を成し遂げました。そのモデル、MiniSeekはSpiderテストセットで91.2%という精度を記録し、これまでの最高精度であった86.6%を大きく上回りました。M...
AI(人工知能)

AGIへの道のりを具体化する「人工汎用知能のレベル」分類フレームワーク

人工汎用知能(AGI)の能力と行動の分類フレームワーク新しい論文で、人工汎用知能(AGI)とその前身となるモデルの能力と行動を分類するための新しいフレームワークを提案されました。このフレームワークは、AGIの性能、汎用性、自律性という三つの...
AI(人工知能)

単眼ビデオから一貫性のある360°動的オブジェクト生成『Consistent4D』

単眼ビデオから動的な3Dオブジェクトを生成する画期的なアプローチであるConsistent4Dについて解説します。Consistent4Dは、複雑な多視点データ収集やカメラキャリブレーションを不要にすることで、360度の動的オブジェクト再構...
AI(人工知能)

GPT-4はチューリングテストに合格するのか?

GPT-4のチューリングテスト:完全な合格とはいえない結果に近年、人工知能の進化により、AIが人間と見分けがつかないほどの言語能力を獲得する日も遠くないと考えられています。このような背景の中、GPT-4が一般公開されたオンラインのチューリン...
AI(人工知能)

オセロ「完璧なプレイで引き分け」との研究結果をPreferred Networksが発表

オセロゲームが両プレイヤーによる完璧なプレイのもとで引き分けになることが、Preferred Networksの研究者によって発表されました。この発見は、AI研究とゲーム理論の分野での重要な進歩を示しており、長年の課題の一端を解決しています...
AI(人工知能)

最先端の音声変換技術『LLVCモデル』自分の声をリアルタイムで別の声に変換可能に

音声変換技術の新時代:LLVCモデルの進化音声変換技術は、常に新しい可能性を模索しており、LLVCモデルはその最先端を行く例です。このモデルは、複雑なアルゴリズムを使いつつ、消費者向けハードウェアでの利用を可能にしました。LLVCモデルの構...