하드웨어 기초 #5 스토리지 ② 구성과 연결 — RAID와 DAS / NAS / SAN
#4에서 디스크 한 장의 종류와 성능을 정리했습니다. 한 장에는 세 가지 한계가 있습니다. 용량에 끝이 있고, 한 장의 속도에 한계가 있으며, 고장 나면 데이터가 사라집니다. 운영에서는 이 한계를 넘으려고 디스크를 여러 장 묶고(RAID), 서버에 다양한 방식으로 연결합니다(DAS,NAS,SAN). 이번 글의 두 주제입니다.
하드웨어 기초 시리즈에서 이번 글의 위치입니다.
- #1 컴퓨터를 움직이는 네 가지 자원 — CPU / 메모리 / 스토리지 / 네트워크
- #2 CPU — 코어 / 스레드 / 클럭 / 캐시, 그리고 vCPU의 정체
- #3 메모리 — RAM과 계층 구조, 스왑이 시작되면 벌어지는 일
- #4 스토리지 ① 장치 — HDD / SSD / NVMe와 IOPS / 처리량 / 지연시간
- #5 스토리지 ② 구성과 연결 — RAID와 DAS / NAS / SAN ← 이번 글
- #6 네트워크 — 대역폭과 지연시간, NIC에서 데이터센터까지
- #7 가상화와 컨테이너 — 물리 서버 한 대가 여러 대가 되는 원리
- #8 클라우드 — 소유에서 임대로, 온프레미스부터 IaaS / PaaS / SaaS까지
- #9 클라우드 인스턴스 사양 읽는 법 — 워크로드에 맞춰 고르기
RAID — 여러 디스크를 하나처럼 #
RAID는 디스크 여러 장을 묶어 운영체제에 한 장처럼 보이게 하는 기술입니다. 묶는 방식에 따라 속도를 얻기도 하고 안전성을 얻기도 합니다. 방식마다 번호가 붙어 있고, 자주 쓰는 것은 넷입니다.
RAID 0 — 스트라이핑 #
데이터를 여러 디스크에 잘라 나눠 씁니다. 두 장에 나눠 쓰면 읽기,쓰기가 거의 두 배 빨라집니다. 대신 안전성은 0입니다. 한 장만 고장 나도 데이터가 흩어진 채 전부 못 쓰게 됩니다. 속도만 노리고 안전성을 포기한 구성입니다.
RAID 1 — 미러링 #
같은 데이터를 두 장에 똑같이 씁니다. 한 장이 고장 나도 다른 장에 그대로 있어 안전합니다. 대신 두 장을 사도 쓸 수 있는 용량은 한 장 분량입니다. 안전성을 위해 용량 절반을 내주는 구성입니다.
RAID 5 / 6 — 패리티 #
데이터를 여러 장에 나눠 쓰되, 패리티라는 복구용 정보를 함께 분산해 둡니다. 한 장이 고장 나면 남은 장들과 패리티로 잃은 데이터를 계산해 복구합니다. RAID 5는 디스크 한 장 고장까지, RAID 6은 두 장 고장까지 견딥니다. 미러링보다 용량 손실이 적어 디스크가 많을수록 효율적입니다.
RAID 10 — 미러링과 스트라이핑의 결합 #
RAID 1로 묶은 쌍을 다시 RAID 0으로 잇습니다. 속도와 안전성을 함께 얻지만 용량 절반을 미러링에 씁니다. 성능과 안전성이 모두 중요한 데이터베이스에서 자주 쓰입니다.
| RAID | 얻는 것 | 잃는 것 | 견디는 고장 |
|---|---|---|---|
| 0 | 속도, 전체 용량 | 안전성 없음 | 0장 |
| 1 | 안전성 | 용량 절반 | 1장 |
| 5 | 안전성 + 용량 효율 | 쓰기 시 패리티 계산 부담 | 1장 |
| 6 | 안전성 강화 | 패리티 부담 더 큼 | 2장 |
| 10 | 속도 + 안전성 | 용량 절반 | 쌍마다 1장 |
RAID는 백업이 아닙니다. RAID는 디스크 고장을 견디게 할 뿐입니다. 실수로 파일을 지우거나, 랜섬웨어에 감염되거나, 잘못된 데이터를 덮어쓰면 그 변경은 모든 디스크에 그대로 반영됩니다. 백업은 별도로 떨어진 곳에 따로 두어야 합니다.
연결 방식 — DAS / NAS / SAN #
RAID가 “디스크를 어떻게 묶는가"였다면, 다음 질문은 “디스크를 서버에 어떻게 연결하는가"입니다. 세 방식으로 갈립니다.
DAS — 직접 연결 #
**DAS(Direct Attached Storage)**는 디스크를 서버에 직접 붙이는 방식입니다. 노트북 안의 디스크, 서버에 꽂힌 디스크가 모두 DAS입니다. 가장 빠르고 단순하지만, 그 서버에서만 쓸 수 있고 서버가 죽으면 함께 접근이 끊깁니다.
NAS — 파일 단위, 네트워크 공유 #
**NAS(Network Attached Storage)**는 네트워크에 연결된 저장 장치를 여러 서버가 파일 단위로 공유하는 방식입니다. 여러 서버가 같은 폴더를 함께 읽고 씁니다. 파일 공유가 목적인 워크로드에 맞고, 네트워크를 거치므로 DAS보다 느립니다.
SAN — 블록 단위, 전용 네트워크 #
**SAN(Storage Area Network)**은 스토리지 전용 고속 네트워크로 디스크를 블록 단위로 서버에 제공합니다. 서버 입장에서는 네트워크 너머에 있는데도 자기 디스크처럼 보입니다. 파일이 아니라 #4에서 본 블록을 그대로 다루므로, 데이터베이스처럼 성능이 중요한 워크로드에 쓰입니다. 전용 네트워크와 장비가 필요해 비쌉니다.
| 방식 | 단위 | 공유 | 성격 |
|---|---|---|---|
| DAS | 블록 | 한 서버 전용 | 빠르고 단순 |
| NAS | 파일 | 여러 서버 공유 | 파일 공유에 적합 |
| SAN | 블록 | 여러 서버에 블록 제공 | 빠르지만 비쌈 |
클라우드 스토리지는 이 개념의 재포장이다 #
여기까지가 이 글의 핵심입니다. 클라우드 스토리지는 새로 발명된 것이 아니라, 위 개념들을 서비스 형태로 다시 포장한 것입니다. AWS를 예로 들면 대응이 깔끔하게 맞습니다.
| 온프레미스 개념 | 클라우드 대응 | 성격 |
|---|---|---|
| DAS (직접 붙은 디스크) | 인스턴스 스토어 | 빠르지만 인스턴스를 멈추면 사라짐 |
| SAN (블록, 네트워크) | EBS | 인스턴스에 붙는 블록 볼륨, 영구 |
| NAS (파일, 네트워크) | EFS / FSx | 여러 인스턴스가 공유하는 파일 |
| RAID 미러링,패리티 | 다중화로 보장하는 내구성 | 여러 장치에 자동 복제 |
#4에서 남겨둔 의문, “인스턴스를 멈추면 인스턴스 스토어 데이터는 사라지는데 EBS는 남는 이유"가 여기서 풀립니다. 인스턴스 스토어는 그 인스턴스에 직접 붙은 DAS라 인스턴스가 멈추거나 종료되면 함께 사라집니다. EBS는 네트워크 너머의 블록 스토리지(SAN에 해당)라 인스턴스와 분리돼 살아남습니다. 클라우드가 광고하는 높은 내구성은 RAID의 미러링과 패리티 개념을 데이터센터 규모로 키워 여러 장치에 자동 복제하는 방식으로 만들어집니다.
자주 만나는 함정 #
“RAID를 했으니 백업은 필요 없다” #
가장 위험한 오해입니다. RAID는 디스크 고장만 견딥니다. 실수로 지운 파일이나 잘못 덮어쓴 데이터, 랜섬웨어는 모든 디스크에 똑같이 반영됩니다. 백업은 반드시 따로 둡니다.
“RAID 5면 안심이다” #
RAID 5는 한 장 고장까지만 견딥니다. 한 장이 고장 나 복구하는 동안 남은 장에 부하가 몰려 두 번째 장이 함께 고장 나는 경우가 있습니다. 디스크가 크고 많으면 RAID 6이나 RAID 10을 검토합니다.
“NAS와 SAN은 같은 것” #
단위가 다릅니다. NAS는 파일을 공유하고, SAN은 블록을 제공합니다. 데이터베이스처럼 블록 수준 성능이 필요하면 NAS로는 부족할 수 있습니다.
“인스턴스 스토어가 빠르니 거기에 데이터베이스를 두자” #
빠른 것은 맞지만 인스턴스를 멈추면 사라집니다. 영구 데이터는 EBS에, 임시 캐시나 스크래치 용도만 인스턴스 스토어에 두는 것이 안전합니다.
정리 #
이번 글에서 잡은 그림입니다.
- RAID는 디스크를 묶어 속도(0), 안전성(1), 둘의 절충(5,6), 둘 다(10)를 얻습니다.
- RAID는 백업이 아닙니다. 디스크 고장만 견디고, 실수,삭제,랜섬웨어는 막지 못합니다.
- 연결 방식은 DAS(직접,블록,전용), NAS(네트워크,파일,공유), SAN(전용 네트워크,블록,고성능)으로 갈립니다.
- 클라우드 스토리지는 이 개념의 재포장입니다. 인스턴스 스토어=DAS, EBS=SAN, EFS=NAS, 높은 내구성은 RAID 다중화의 데이터센터 규모 버전입니다.
다음 — 네트워크 #
지금까지 한 서버 안의 자원을 다뤘다면, 이제 서버 바깥으로 나갑니다. NAS와 SAN, EBS가 모두 네트워크를 거친다는 점에서 이미 예고된 주제입니다. #6 네트워크 — 대역폭과 지연시간, NIC에서 데이터센터까지에서는 운영에서 가장 자주 혼동되는 대역폭과 지연시간의 차이, 거리가 만드는 지연의 한계, 그리고 같은 AZ와 리전 간과 인터넷이 왜 다른지를 정리하겠습니다.