모든 포스트
RAG 심화 #3 하이브리드 검색 — 벡터와 키워드 결합
의미 검색은 제품 코드와 고유 명사에 약하고, 키워드 검색은 동의어에 약합니다. BM25 키워드 검색을 만들고 RRF로 벡터 검색과 결합해서, 두 방식이 서로 부족한 부분을 보완하는 하이브리드 검색을 구현합니다.
RAG 심화 #2 검색 품질을 좌우하는 청킹 전략
검색 실패의 뿌리는 검색이 아니라 그 전 단계인 청킹에 있는 경우가 많습니다. 고정 크기 분할의 한계, 구조 기반 청킹, 표와 코드 다루기, 메타데이터, 작게 찾고 크게 넣는 부모-자식 청킹까지 다룹니다.
RAG 심화 #1 RAG가 틀리는 지점부터 찾기
RAG의 답이 이상할 때 무작정 프롬프트를 고치면 운에 맡기는 것과 같습니다. 실패를 검색 실패와 생성 실패로 가르고, 골든셋으로 기준선을 만들어 개선을 측정 가능하게 만드는 것부터 시작합니다.
하드웨어 고급 #7 펌웨어, BMC, 수명주기 — 서버 안의 또 다른 컴퓨터
메인 CPU와 독립적으로 항상 켜져 있는 관리용 컴퓨터 BMC를 다룹니다. 원격 콘솔과 전원 제어, IPMI와 Redfish, 펌웨어 스택과 업데이트 운영, SMART와 ECC 카운터 기반 고장 예측, 관리망 보안, 그리고 보증 만료부터 디스크 폐기까지의 수명주기를 정리하고 하드웨어 고급 시리즈를 마무리합니다.
AI 에이전트 개발 실전 #7 실전 프로젝트: 이슈 트리아지 에이전트
시리즈에서 다룬 부품을 모두 묶어 GitHub 이슈를 분류하고 라벨과 답변을 제안하는 트리아지 에이전트를 완성합니다. 읽기 도구와 승인이 필요한 쓰기 도구, 골든셋 기반 평가까지 작업합니다.
하드웨어 고급 #6 데이터센터 냉각과 랙 — 전기는 결국 열이 된다
서버에 들어간 전력은 거의 전부 열이 되어 나옵니다. 전면 흡기·후면 배기라는 기류의 기본에서 출발해 핫아일·콜드아일 컨테인먼트, 랙 밀도와 공랭의 한계, D2C·액침 같은 액체 냉각, ASHRAE 온도 기준과 PUE의 관계까지 데이터센터 냉각의 전체 그림을 정리합니다.
AI 에이전트 개발 실전 #6 MCP 서버 직접 만들기
LLM 앱 개발 실전 11편에서는 남이 만든 MCP 서버에 연결했습니다. 이번에는 우리 도구를 MCP 서버로 직접 만듭니다. FastMCP로 서버 작성, 우리 에이전트 루프에 연결, 도구를 서버로 분리할 기준까지 다룹니다.
하드웨어 고급 #5 데이터센터 전력 — 서버를 더 못 꽂는 진짜 이유
랙에 빈 칸이 남아 있어도 서버를 못 꽂는 이유는 전력 예산입니다. PSU 이중화와 A/B 전원 피드, 랙 단위 kW 계약, PDU와 UPS, 발전기와 ATS, PUE, 그리고 GPU 서버가 끌어올린 전력 밀도까지, 서버가 살아가는 전력 환경을 운영자 관점으로 정리하겠습니다.
AI 에이전트 개발 실전 #5 서브에이전트로 일 나누기
하나의 에이전트가 모든 일을 하면 컨텍스트도 책임도 비대해집니다. 서브에이전트로 일을 위임하는 이유, delegate 도구 구현, 오케스트레이터-워커 패턴과 병렬 실행, 위임이 과해지지 않게 막는 기준까지 다룹니다.
하드웨어 고급 #4 ZFS 심화 — RAID와 파일시스템이 하나가 될 때
ZFS는 RAID·볼륨 관리·파일시스템을 한 층으로 합쳐 전통 스택의 구조적 문제를 풀었습니다. 쓰기 구멍을 없애는 CoW, 읽을 때마다 검증하는 체크섬과 자가 치유, 데이터만 복사해 빠른 resilver, RAIDZ와 ARC, 스냅샷과 send/recv, lz4 압축까지 운영 관점으로 정리합니다.
AI 에이전트 개발 실전 #4 긴 작업을 버티는 컨텍스트 관리
에이전트가 오래 돌수록 대화가 자라 컨텍스트 한계에 다가갑니다. 도구 결과 다이어트, 오래된 결과 비우기, 요약 압축과 서버측 compaction, 파일 기반 스크래치패드까지 긴 작업을 버티는 기법을 정리합니다.