すべての記事
ハードウェア上級 #3 メモリ深掘り — ページキャッシュ・THP・帯域幅
ページキャッシュの読み取り・書き込みの経路から、THP が作る遅延スパイク、明示的 hugepages と TLB、swappiness の実際の実装と zswap、そしてコアが遊んでいても速くならないメモリ帯域幅のボトルネックまで、カーネルメモリメカニズムの内側を扱います。
AI エージェント開発実践 #3 計画と自己修正
複数の段階がある仕事を任せるには、エージェントに行動ルールと計画が必要です。システムプロンプトの設計、計画を先に立てさせる方法、途中の検証と再試行、adaptive thinking で思考の深さを調節する方法まで扱います。
ハードウェア上級 #2 eBPF 観測 — 平均が隠すテールを見る
eBPF はカーネル内で安全に実行される小さなプログラムでシステムイベントを直接トレースする技術です。biolatency と runqlat で平均指標が隠す遅延分布とテールを読む方法、BCC ツールの地図、運用時のオーバーヘッドの注意点まで整理します。
AI エージェント開発実践 #2 良いツールを設計する
エージェントの品質の差は、ほとんどがツールで決まります。モデルが読むドキュメントとしての description、スキーマ設計、エラーメッセージの設計、危険なツールの分類と確認手順まで、ツール設計の原則を整理します。
カーナビは渋滞をどうやって知るのか? Google マップ・リアルタイム渋滞情報の仕組み
事故のニュースが流れる前にカーナビが迂回路を案内できる秘密は、ナビを起動した車たち自身が送る速度データにあります。プローブデータと区間速度の集計、到着予想時刻の予測、時間を重みにした経路探索、迂回の分散までを、非開発者の視点で整理します。
ハードウェア上級 #1 CPU マイクロアーキテクチャと perf — 同じ 100% が違う理由
CPU 使用率が同じ 100% でも、コアがこなした仕事の量は違います。IPC とキャッシュミス、分岐予測ミスで使用率の裏のマイクロアーキテクチャを読み、perf stat の数字からメモリ待ちと演算の飽和を見分ける方法を扱います。
AI エージェント開発実践 #1 エージェントループを堅牢にする
LLM アプリ開発で作った最小のエージェントループを実戦レベルに引き上げます。stop_reason をすべて処理し、ツールのエラーを結果として返し、リトライとロギングまで扱います。AI エージェント開発実践シリーズの出発点です。
Google 翻訳・DeepL はどうやって翻訳しているのか? 機械翻訳の仕組み
旅行先でカメラをかざすだけで、外国語の看板が日本語に変わります。Google 翻訳や DeepL が翻訳する仕組みをルールベース・統計ベース・ニューラルネットワークという三つの世代に分けてたどり、カメラ翻訳の正体と翻訳機がいまだに間違える理由までを、非開発者の視点で整理します。
ハードウェア中級 #9 実践:遅くなったサーバーを診断する — シリーズのまとめ
「サービスが遅い」という報告から出発し、4 つのリソースを順に絞り込んでいく診断ウォークスルーです。症状を定義し、リソースごとに点検し、仮説を確かめ、処方して再測定するところまで進みます。チューニングの原則とともにハードウェア中級シリーズを締めくくります。