すべての記事
RAG 上級講座 #3 ハイブリッド検索 — ベクトルとキーワードの組み合わせ
意味検索は製品コードや固有名詞に弱く、キーワード検索は同義語に弱いです。BM25 キーワード検索を作り、RRF でベクトル検索と組み合わせて、互いの弱点を補い合うハイブリッド検索を実装します。
RAG 上級講座 #2 検索品質を左右するチャンキング戦略
検索失敗の根は検索そのものではなく、その前の段階であるチャンキングにある場合が多いです。固定サイズ分割の限界、構造ベースのチャンキング、表とコードの扱い、メタデータ、小さく探して大きく入れる親子チャンキングまで扱います。
RAG 上級講座 #1 RAG が間違う場所をまず特定する
RAG の答えがおかしいとき、やみくもにプロンプトを直すのは運任せと同じです。失敗を検索の失敗と生成の失敗に切り分け、ゴールデンセットでベースラインを作って、改善を測定可能にするところから始めます。
ハードウェア上級 #7 ファームウェア・BMC・ライフサイクル — サーバーの中のもう 1 台のコンピュータ
メイン CPU と独立して常に動き続ける管理用コンピュータ BMC を扱います。リモートコンソールと電源制御、IPMI と Redfish、ファームウェアスタックとアップデート運用、SMART と ECC カウンタによる故障予測、管理ネットワークのセキュリティ、そして保証満了からディスク廃棄までのライフサイクルを整理し、ハードウェア上級シリーズを締めくくります。
AI エージェント開発実践 #7 実践プロジェクト:イシュートリアージエージェント
シリーズで扱った部品をすべて束ねて、GitHub のイシューを分類しラベルと返信を提案するトリアージエージェントを完成させます。読み取りツールと承認が必要な書き込みツール、ゴールデンセットによる評価まで取り組みます。
ハードウェア上級 #6 データセンターの冷却とラック — 電気は結局熱になる
サーバーに入った電力はほぼすべて熱になって出ていきます。前面吸気・背面排気という気流の基本から出発し、ホットアイル・コールドアイルのコンテインメント、ラック密度と空冷の限界、D2C・液浸といった液体冷却、ASHRAE の温度基準と PUE の関係まで、データセンター冷却の全体像を整理します。
AI エージェント開発実践 #6 MCP サーバーを自作する
LLM アプリ開発の第11回では、既存の MCP サーバーに接続しました。今回は独自のツールを MCP サーバーとして自作します。FastMCP でのサーバー作成、エージェントループへの接続、ツールをサーバーに分離する基準まで扱います。
ハードウェア上級 #5 データセンターの電力 — サーバーをこれ以上挿せない本当の理由
ラックに空きスロットが残っていてもサーバーを挿せない理由は電力バジェットです。PSU の冗長化と A/B 電源フィード、ラック単位の kW 契約、PDU と UPS、発電機と ATS、PUE、そして GPU サーバーが押し上げた電力密度まで、サーバーが生きる電力環境を運用者の視点で整理します。
AI エージェント開発実践 #5 サブエージェントで仕事を分ける
一つのエージェントがすべてをこなすと、コンテキストも責任も肥大化します。サブエージェントに仕事を委任する理由、delegate ツールの実装、オーケストレーター・ワーカーパターンと並列実行、委任が過剰にならないための基準まで扱います。
ハードウェア上級 #4 ZFS 深掘り — RAID とファイルシステムがひとつになるとき
ZFS は RAID・ボリューム管理・ファイルシステムを 1 つの層に統合し、従来スタックの構造的な問題を解決しました。書き込みホールをなくす CoW、読み取りのたびに検証するチェックサムと自己修復、データだけをコピーして速い resilver、RAIDZ と ARC、スナップショットと send/recv、lz4 圧縮まで運用の観点で整理します。
AI エージェント開発実践 #4 長い作業を支えるコンテキスト管理
エージェントが長く動くほど会話が増え、コンテキストの限界に近づきます。ツール結果のダイエット、古い結果の整理、要約による圧縮とサーバー側のコンパクション、ファイルベースのスクラッチパッドまで、長い作業を支える技法を整理します。