本記事では、LLMの「設計図」と「実際のふるまい」がどうズレているのか調べた取り組みを紹介します。 ChatGPTやClaudeといったLLMは、「モデル仕様書」と呼ばれるルールに沿って訓練されています。ところがこの仕様 […] The post LLMの設計仕様と挙動にはギャップがある モデルが自然に大事にしている価値観を探る first appeared on AIDB.| AIDB
本記事では、LLMが実在の人物をまねた「デジタルツイン」として本当に使えるのかを検証した大規模な研究を紹介します。 もしLLMが本人の代わりにアンケートや実験に答えられるなら、調査をより手軽に、速く、何度でも実施できるよ […] The post LLMは実在する人間の代わりに回答できる?人間デジタルツインとしての能力に迫る first appeared on AIDB.| AIDB
AGIという言葉は、AIが人間のようにあらゆる知的作業をこなせるようになった状態を指す言葉として広く使われています。しかし実際には、その定義は非常に曖昧です。 今回、AGIを10の認知領域に分けて評価する体系的な方法が提 […] The post AGIとは、どんな能力があるAIのことか? first appeared on AIDB.| AIDB
LLMの実用性を高めるための手段としてRAGは注目されています。 しかし、RAGにおいてモデルに渡すべき情報は、実は使用するLLMによって異なる可能性があります。 本記事では、この「LLMによって異なる”情報の有用性”」 […] The post RAGで取得すべき情報はLLMごとの「データの有用性」で異なる first appeared on AIDB.| AIDB
ブックマーク 本企画では、AIDBのXで紹介されたいくつかの最新AI研究を、ダイジェスト形式でお届けします。 普段の有料会員向け記事では、技術的な切り口から研究を詳しく紹介していますが、この企画では科学的な知識として楽し […] The post 考えるAIとどう組むかの実践録 first appeared on AIDB.| AIDB
当サイトの利用にはAIDBのアカウントが必要です。また記事の購読には、アカウント作成後の決済が必要です。ログイン アカウント作成※ログイン/初回登録後、下記ボタンを押してください。AIDBとはプレミアム会員(記事の購読) […] The post 今週の注目AI論文リスト(論文公開日2025/10/13~10/17) first appeared on AIDB.| AIDB
本記事では、生成AIの導入が現場の開発者における「燃え尽き」に影響を与えているかを取り上げます。 生成AIツールは、私たちの働き方を大きく変えつつあります。多くの企業が「AIによって生産性が飛躍的に向上する」という期待の […] The post 生成AIは労働者やエンジニアの「燃え尽き」を起こす引き金になりうるのか? first appeared on AIDB.| AIDB
本記事では、RAG(Retrieval-Augmented Generation)の仕組みと役割、そして今もなお注目されている理由を紹介します。最近のLLMは大幅に進化し、昔と比べて多くの問いに正確に答えられるようになっ […] The post LLM自体の性能が飛躍的に向上した今、RAGに求められることとは first appeared on AIDB.| AIDB
本記事では、LLMにプログラミングの相談をしたときに、回答をどれほど信頼できるのかをユニークな角度から考察した研究を紹介します。研究者らは「ダニング=クルーガー効果」、つまり知らない分野ほど人間は自信満々になってしまう心 […] The post 知らない分野ほど自信満々になってしまう現象はLLMによるプログラミングでも起きる? first appeared on AIDB.| AIDB
本記事では、LLMを使った消費者調査の新しい手法を紹介します。新製品を開発する際、実際の消費者を集めて製品コンセプトを見せ、購買意欲を尋ねる調査には多額のコストがかかります。| AIDB
---ここから有料部分です---AgentCompass: 生産現場におけるエージェントワークフローの信頼性の高い評価に向けてAgentCompass: Towards Reliable Evaluation of Age...| AIDB
本記事では、AIによる情報取得だけを対象にWebページの内容を守る手法を紹介します。一般的な手法では、LLMによるリアルタイムな情報再利用への完全な対応が難しい。一方で、Webの公開性は維持したい。| AIDB
本記事では、LLMアプリにおいて、セキュリティ上の懸念にどう対応するかを検討した研究を紹介します。なかでもアプリの説明や出力に仕込まれた誘導によってLLMの判断や実行内容が変わってしまうリスクにとくに注目します。| AIDB
LLMの普及が急速に進む中、プロンプトと応答を通して情報漏洩や不正操作が行われるプロンプトインジェクションが発生するリスクが指摘されています。そこで今回研究者らは具体的な防御手法を検討し、実践的な知見をまとめました。| AIDB
本記事では、主要なLLM事業者6社のプライバシーポリシーを分析した研究を紹介します。調査は、チャットでやり取りされたデータがどのように扱われているかを中心に行われました。| AIDB
本記事では、人間とLLMベースのエージェントが協働する仕組みを体系的に整理した研究を紹介します。AIを組み込んだエージェントの活用が進む中で、人間との相互作用をどう設計するかが重要な課題となっています。| AIDB
本記事では、自然言語で書かれたあいまいなリクエストが、LLMによるコード生成を不安定にする要因となっている問題と、それに対する修正のアプローチを紹介します。| AIDB
本記事では、コードドキュメントを自動生成するLLMエージェント設計に関する研究を紹介します。複雑なコードベースに対応するため、エージェント間で役割を分担し、依存関係を踏まえた段階的な処理を行うアプローチが提案されています。| AIDB
現在AIDBの記事は約9割がプレミアム会員向けとなっております。(残りの約1割はビジターと無料会員向けに開放されています)AIDBコンテンツのほとんどは論文を扱っています。| AIDB
本記事では、LLMエージェントの失敗パターンを分析した研究を紹介します。自律的に動くエージェントを設計しても、思うようにタスクをこなせないことは少なくありません。| AIDB
本記事では、LLMエージェントのワークフロー構築に関する枠組みと分類を紹介します。エージェントの設計や連携を進めるうえで、機能や構造をどう整理するかは重要な論点です。| AIDB
本記事では、推論特化型LLMが「考えているように見える表現」にどれほど影響されるかを検証した研究を紹介します。高度な推論能力を持つとされるモデルであっても、表面的な言い回しに判断が左右される可能性があるという点に着目した実験です。| AIDB
運用現場でのLLMの活用が進み、AIOpsのあり方も少しずつ変わりつつあります。これまでのように異常を検知して分類するだけでなく、レポートの作成や対処の提案など、より人に近い作業を担う場面が増えています。| AIDB
本記事では、LLMのプライバシーリスクと実践的な対策について紹介します。サービスにLLMを組み込む場面が増えるなかで、どこにどんなリスクがあるのかをあらかじめ把握しておくことが求められています。| AIDB
本記事では、LLMとの関わり方を12の質問で可視化する尺度を紹介します。判断を任せる使い方と、気づかぬうちに感情を寄せてしまう関わり方の2つを軸に、依存の傾向を測る仕組みです。| AIDB
本記事では、LLMに対するプロンプト設計手法をソフトウェア開発タスクに適用して検証した研究を紹介します。| AIDB
本記事では、Vibe Coding(バイブコーディング)およびAgentic Coding(エージェンティックコーディング)に関する最新の調査をお届けします。| AIDB
本記事では、AIが生成したコードや修正パッチなどの成果物を、LLM(AI自身)を使ってより正確に評価するための新たな研究を紹介します。AIによるコード生成が普及する一方で、その品質や正確性をどう評価するのかが課題になっています。| AIDB
LLMのRAG(外部知識検索による強化)についての調査結果が報告されています。基本フレームワークと各構成要素の詳細、評価、そして今後の発展について言及されており網羅的です。本記事では、その報告内容を抜粋してお届けします。| AIDB
テキストと表の両方を含むハイブリッドな文書からLLMで情報を抽出する能力についてはまだ十分に研究されていません。そこで研究者らは、分割・再結合ベースの方法論を提案しています。実験により、抽出の精度が格段に上昇することを明らかにしました。| AIDB