本記事では、AIコーディングエージェントとして知られる「Claude Code」が実際にどう使われているかの調査結果を紹介します。 本記事の関連研究 ChatGPTは実際に開発現場でどう使われているか GitHubのプル […] The post Claude Code生成コードが実際の開発でどう扱われているかの調査結果 first appeared on AIDB.| AIDB
ブックマーク 本企画では、AIDBのXで紹介されたいくつかの最新AI研究を、ダイジェスト形式でお届けします。 普段の有料会員向け記事では、技術的な切り口から研究を詳しく紹介していますが、この企画では科学的な知識として楽し […] The post 人を支えるAIの現在地 働く・学ぶ・考えるの再設計 first appeared on AIDB.| AIDB
当サイトの利用にはAIDBのアカウントが必要です。また記事の購読には、アカウント作成後の決済が必要です。ログイン アカウント作成※ログイン/初回登録後、下記ボタンを押してください。AIDBとはプレミアム会員(記事の購読) […] The post 今週の注目AI論文リスト(論文公開日2025/9/29~10/3) first appeared on AIDB.| AIDB
本記事では、LLMの出力が似たようなものになりやすい現象について、それが本当に問題なのかどうかをタスクごとに見ていきます。 タスクによっては、同じ答えを返すことが望ましい場合もあれば、視点や言い回しに幅があったほうがよい […] The post LLMの均質な回答が良いか悪いかはタスクで決まる first appeared on AIDB.| AIDB
本記事では、構造化出力がLLMの質にどう影響するかを取り上げます。出力の形式を変えることで、モデルのふるまいがどう変わるのか。タスクや指示の内容によって、その影響は変わるのか。こうした因果関係を見ていきます。 背景 LL […] The post JSONなどの構造化出力はLLMの質にどう影響するか first appeared on AIDB.| AIDB
本記事では、Copilotを使う際に気をつけたいポイントとして、プロンプトインジェクションによる機密情報の漏洩リスクを検証した事例を紹介します。 プロンプトインジェクションとは、外部のメールや文書に紛れた“指示”が、LL […] The post Copilotサービスを使う上で気を付けたいプロンプトインジェクションによる機密情報漏洩リスク first appeared on AIDB.| AIDB
本記事では、中小企業でLLMを安全に導入するための原則と、その実現を支えるフレームワークを紹介します。 LLMの活用が広がる中で、中小企業も活用の可能性を感じつつ、どう取り組めばよいか悩んでいるケースは少なくありません。 […] The post 中小企業におけるLLM導入を安全なものにするための原則とフレームワーク first appeared on AIDB.| AIDB
本記事では、LLMが誤ってリクエストを拒否してしまう現象について調べた研究を紹介します。 ペルソナの指定やタスクの内容、プロンプトの書き方、使うモデルによって、ふるまいがどのように変わるのかを整理しています。見過ごされが […] The post LLMの誤拒否はいつ起きる ペルソナ・タスク・プロンプト・モデルの影響 first appeared on AIDB.| AIDB
ブックマーク 本企画では、AIDBのXで紹介されたいくつかの最新AI研究を、ダイジェスト形式でお届けします。 普段の有料会員向け記事では、技術的な切り口から研究を詳しく紹介していますが、この企画では科学的な知識として楽し […] The post AIが世界をどう理解し、人々はそれをどう使い、社会や経済にどう効くのか first appeared on AIDB.| AIDB
---ここから有料部分です---AgentCompass: 生産現場におけるエージェントワークフローの信頼性の高い評価に向けてAgentCompass: Towards Reliable Evaluation of Age...| AIDB
本記事では、AIによる情報取得だけを対象にWebページの内容を守る手法を紹介します。一般的な手法では、LLMによるリアルタイムな情報再利用への完全な対応が難しい。一方で、Webの公開性は維持したい。| AIDB
本記事では、LLMアプリにおいて、セキュリティ上の懸念にどう対応するかを検討した研究を紹介します。なかでもアプリの説明や出力に仕込まれた誘導によってLLMの判断や実行内容が変わってしまうリスクにとくに注目します。| AIDB
LLMの普及が急速に進む中、プロンプトと応答を通して情報漏洩や不正操作が行われるプロンプトインジェクションが発生するリスクが指摘されています。そこで今回研究者らは具体的な防御手法を検討し、実践的な知見をまとめました。| AIDB
本記事では、主要なLLM事業者6社のプライバシーポリシーを分析した研究を紹介します。調査は、チャットでやり取りされたデータがどのように扱われているかを中心に行われました。| AIDB
本記事では、人間とLLMベースのエージェントが協働する仕組みを体系的に整理した研究を紹介します。AIを組み込んだエージェントの活用が進む中で、人間との相互作用をどう設計するかが重要な課題となっています。| AIDB
本記事では、自然言語で書かれたあいまいなリクエストが、LLMによるコード生成を不安定にする要因となっている問題と、それに対する修正のアプローチを紹介します。| AIDB
本記事では、コードドキュメントを自動生成するLLMエージェント設計に関する研究を紹介します。複雑なコードベースに対応するため、エージェント間で役割を分担し、依存関係を踏まえた段階的な処理を行うアプローチが提案されています。| AIDB
本記事は、Vibe CodingとAgentic Codingの現在地【前編】~それぞれの特徴~の続きです。| AIDB
セマンティックとはsemantic と書きます。「意味の」、「意味論的な」という形容詞です。形容詞なので名詞型があると思いきや、存在しません。| AIDB
現在AIDBの記事は約9割がプレミアム会員向けとなっております。(残りの約1割はビジターと無料会員向けに開放されています)AIDBコンテンツのほとんどは論文を扱っています。| AIDB
本記事では、LLMエージェントの失敗パターンを分析した研究を紹介します。自律的に動くエージェントを設計しても、思うようにタスクをこなせないことは少なくありません。| AIDB
本記事では、LLMエージェントのワークフロー構築に関する枠組みと分類を紹介します。エージェントの設計や連携を進めるうえで、機能や構造をどう整理するかは重要な論点です。| AIDB
本記事では、推論特化型LLMが「考えているように見える表現」にどれほど影響されるかを検証した研究を紹介します。高度な推論能力を持つとされるモデルであっても、表面的な言い回しに判断が左右される可能性があるという点に着目した実験です。| AIDB
運用現場でのLLMの活用が進み、AIOpsのあり方も少しずつ変わりつつあります。これまでのように異常を検知して分類するだけでなく、レポートの作成や対処の提案など、より人に近い作業を担う場面が増えています。| AIDB
本記事ではLLMと一緒に進めるソフトウェア設計の方法を紹介します。設計作業は負担が大きく、もっと効率的に進めたいと感じる人も多いはずです。最近はコード生成などでLLMを使う事例が増えていますが、設計作業での活用はまだこれからです。| AIDB
本記事では、LLMのプライバシーリスクと実践的な対策について紹介します。サービスにLLMを組み込む場面が増えるなかで、どこにどんなリスクがあるのかをあらかじめ把握しておくことが求められています。| AIDB
本記事では、LLMとの関わり方を12の質問で可視化する尺度を紹介します。判断を任せる使い方と、気づかぬうちに感情を寄せてしまう関わり方の2つを軸に、依存の傾向を測る仕組みです。| AIDB
本記事では、LLMに対するプロンプト設計手法をソフトウェア開発タスクに適用して検証した研究を紹介します。| AIDB
本記事では、Vibe Coding(バイブコーディング)およびAgentic Coding(エージェンティックコーディング)に関する最新の調査をお届けします。| AIDB
本記事では、AIが生成したコードや修正パッチなどの成果物を、LLM(AI自身)を使ってより正確に評価するための新たな研究を紹介します。AIによるコード生成が普及する一方で、その品質や正確性をどう評価するのかが課題になっています。| AIDB
LLMのRAG(外部知識検索による強化)についての調査結果が報告されています。基本フレームワークと各構成要素の詳細、評価、そして今後の発展について言及されており網羅的です。本記事では、その報告内容を抜粋してお届けします。| AIDB
テキストと表の両方を含むハイブリッドな文書からLLMで情報を抽出する能力についてはまだ十分に研究されていません。そこで研究者らは、分割・再結合ベースの方法論を提案しています。実験により、抽出の精度が格段に上昇することを明らかにしました。| AIDB