#Claude
34 件の記事
RAG 上級講座 #2 検索品質を左右するチャンキング戦略
検索失敗の根は検索そのものではなく、その前の段階であるチャンキングにある場合が多いです。固定サイズ分割の限界、構造ベースのチャンキング、表とコードの扱い、メタデータ、小さく探して大きく入れる親子チャンキングまで扱います。
RAG 上級講座 #1 RAG が間違う場所をまず特定する
RAG の答えがおかしいとき、やみくもにプロンプトを直すのは運任せと同じです。失敗を検索の失敗と生成の失敗に切り分け、ゴールデンセットでベースラインを作って、改善を測定可能にするところから始めます。
AI エージェント開発実践 #7 実践プロジェクト:イシュートリアージエージェント
シリーズで扱った部品をすべて束ねて、GitHub のイシューを分類しラベルと返信を提案するトリアージエージェントを完成させます。読み取りツールと承認が必要な書き込みツール、ゴールデンセットによる評価まで取り組みます。
AI エージェント開発実践 #6 MCP サーバーを自作する
LLM アプリ開発の第11回では、既存の MCP サーバーに接続しました。今回は独自のツールを MCP サーバーとして自作します。FastMCP でのサーバー作成、エージェントループへの接続、ツールをサーバーに分離する基準まで扱います。
AI エージェント開発実践 #5 サブエージェントで仕事を分ける
一つのエージェントがすべてをこなすと、コンテキストも責任も肥大化します。サブエージェントに仕事を委任する理由、delegate ツールの実装、オーケストレーター・ワーカーパターンと並列実行、委任が過剰にならないための基準まで扱います。
AI エージェント開発実践 #4 長い作業を支えるコンテキスト管理
エージェントが長く動くほど会話が増え、コンテキストの限界に近づきます。ツール結果のダイエット、古い結果の整理、要約による圧縮とサーバー側のコンパクション、ファイルベースのスクラッチパッドまで、長い作業を支える技法を整理します。
AI エージェント開発実践 #3 計画と自己修正
複数の段階がある仕事を任せるには、エージェントに行動ルールと計画が必要です。システムプロンプトの設計、計画を先に立てさせる方法、途中の検証と再試行、adaptive thinking で思考の深さを調節する方法まで扱います。
AI エージェント開発実践 #2 良いツールを設計する
エージェントの品質の差は、ほとんどがツールで決まります。モデルが読むドキュメントとしての description、スキーマ設計、エラーメッセージの設計、危険なツールの分類と確認手順まで、ツール設計の原則を整理します。
AI エージェント開発実践 #1 エージェントループを堅牢にする
LLM アプリ開発で作った最小のエージェントループを実戦レベルに引き上げます。stop_reason をすべて処理し、ツールのエラーを結果として返し、リトライとロギングまで扱います。AI エージェント開発実践シリーズの出発点です。
LLM アプリ開発 #13 実践プロジェクト: 社内文書 Q&A ボット
これまでのかけらを一つに束ねて、社内文書に答える Q&A ボットを最初から最後まで作ります。RAG、ストリーミング、根拠プロンプト、会話メモリを組み合わせたシリーズの締めくくりです。
LLM アプリ開発 #12 コスト・評価・観測
作ったアプリを実際に運用するときに必要なものを扱います。トークン費用の削減とプロンプトキャッシュ、品質を測る評価、そして動作を観測する方法を整理します。
LLM アプリ開発 #11 MCP でツールを接続する
ツールを接続する標準である MCP(Model Context Protocol)を扱います。毎回ツールを手で書く代わりに、すでに作られたツールサーバーに Claude をつなぐ方法を見ていきます。