スクールオブウェブ 😉 net

プログラミングとインフラを学ぶ場所。

GHCR (GitHub Container Registry) とは — Docker Hub との違い、使い方、料金

ghcr.io の正体から整理します。GHCR とは何か、Docker Hub と何が違うのか (pull 制限、権限モデル、料金)、PAT の発行から push/pull までの使い方、そして GitHub Actions 連携と運用のコツまで一本でまとめます。

2026年7月1日水曜日読了 5分

シリーズの五つの軸を運用チェックリストにまとめ、ドキュメント Q&A ボットに適用します。計測、ルーティング、キャッシング、バッチ、信頼性、セキュリティを一つずつ有効にしながら、リクエストあたりのコストと安定性がどう変わるかを確かめ、四つのシリーズにわたる AI トラックを締めくくります。

2026年6月30日火曜日読了 6分

プロンプトインジェクションは入力テキストでアプリの動作を変えようとする試みで、RAG とエージェントの時代には文書やツール結果を経由して入り込みます。単一の防御線ではなく何層もの防御、ツール権限の最小化、出力の検証、ロギングのデータ境界まで扱います。

2026年6月29日月曜日読了 6分

429 と 529 は障害ではなく日常です。レートリミットの仕組み（RPM・トークン上限）、retry-after を尊重するリトライ、タイムアウトとストリーミング、それでもだめなときのフォールバック（モデル格下げ・キューイング・丁寧な失敗）まで、止まらない構造を作ります。

2026年6月28日日曜日読了 5分

今すぐ答えが要らない作業まで、リアルタイム API に送っていないでしょうか。Batches API は大量のリクエストを非同期で処理する代わりに、すべてのトークンを 50% 割引します。バッチに向く作業の選び方、提出と回収、運用パターンまで扱います。

2026年6月27日土曜日読了 6分

毎リクエスト繰り返されるシステムプロンプトとツール定義をキャッシュすれば、その区間の入力費用は10分の1になります。接頭辞一致という大原則、安定した接頭辞の設計、cache_control の配置、沈黙のキャッシュ無効化を探す監査まで扱います。

2026年6月26日金曜日読了 6分

コスト削減の最大のレバーはモデル選択です。count_tokens による送信前の計測、出力のダイエット、作業の難易度別モデルルーティングの設計、effort の調整まで。品質を守りながらコストを下げる順序を扱います。

2026年6月25日木曜日読了 5分

動く LLM アプリと運用できる LLM アプリは別物です。コスト・レイテンシ・信頼性・品質・セキュリティという五つの軸で運用の地図を描き、すべての出発点であるリクエスト単位の計測から作ります。