AWS Certified Cloud Practitioner (CLF-C02) #3 Domain 1-2 클라우드 디자인: Well-Architected 6 Pillars

9 분 소요

#2에서 클라우드의 가치 제안,CAF,글로벌 인프라를 잡았습니다. 도메인 1의 후반부로 넘어가 Well-Architected Framework의 6개 원칙을 정리합니다.

Well-Architected는 단순한 체크리스트가 아니라 AWS가 다년간의 실무 사례에서 추출한 설계 지침의 집합입니다. CLF-C02 시험에서는 시나리오를 던지고 “이 시나리오가 강조하는 원칙은 무엇인가” 또는 “이 원칙의 모범 사례는 무엇인가” 형태로 출제됩니다.

6개 원칙 한눈에 #

#원칙한 줄 정의핵심 어휘
1Operational Excellence시스템을 운영하고 모니터링하며 개선하는 능력자동화, IaC, CloudFormation, CloudWatch
2Security데이터,시스템,자산을 보호하는 능력IAM, 암호화, 최소 권한, KMS
3Reliability의도한 기능을 정확히 수행하고 장애에서 복구하는 능력Multi-AZ, 백업, Auto Scaling, 페일오버
4Performance Efficiency컴퓨팅 자원을 효율적으로 사용하는 능력적절한 인스턴스 타입, 캐싱, 스케일링
5Cost Optimization비용 효율을 지속 유지하는 능력Reserved Instance, Spot, Trusted Advisor
6Sustainability워크로드의 환경 영향을 최소화자원 활용도, 효율적 리전 선택

이 6개의 순서는 외울 필요가 없습니다. 다만 각 원칙이 잡으려는 트레이드오프의 축은 머릿속에 있어야 합니다. 예를 들어 비용 최적화와 성능 효율은 종종 충돌하고, 신뢰성을 높이면 비용이 늘어납니다. 시험 문항은 어떤 원칙의 관점에서 정답을 골라야 하는가를 먼저 파악하는 능력을 묻습니다.

1) Operational Excellence: 운영 우수성 #

운영 우수성은 시스템을 안정적으로 운영하고 지속적으로 개선하는 능력입니다. 일회성 셋업이 아니라 반복 가능한 프로세스를 만드는 데 중점을 둡니다.

설계 지침 #

  • 운영을 코드로 수행한다 (IaC). 수동 설정이 아니라 CloudFormation/Terraform 같은 코드로
  • 작고 자주 되돌릴 수 있는 변경. 큰 한 번의 변경 대신 작은 변경을 자주
  • 운영 절차를 자주 개선한다. Game day 같은 연습으로 절차를 검증
  • 실패를 예상하고 학습한다. Postmortem 문화

대응 서비스 #

서비스설명
AWS CloudFormationIaC, 인프라를 YAML/JSON 코드로 관리
AWS Systems Manager운영 자동화, Patch Manager,Run Command
AWS CloudTrailAPI 호출 감사 로그
Amazon CloudWatch메트릭,로그,알람
AWS Config리소스 구성 변경 추적

시험 출제 패턴 #

“수동으로 인프라를 만들고 있어 환경이 일관되지 않다, 어떤 원칙이 강조되어야 하는가?” → Operational Excellence (정답 보조 키워드: IaC, CloudFormation).

2) Security: 보안 #

보안 원칙은 시험에서 가장 자주 출제됩니다. 데이터,시스템,자산을 안전하게 유지하는 능력입니다.

설계 지침 #

  • 강한 신원 기반 (Strong Identity Foundation). IAM으로 최소 권한, MFA
  • 모든 계층에 보안 적용. VPC,서브넷,인스턴스,앱 각 계층에
  • 전송 중,저장 중 데이터 암호화. TLS / KMS
  • 이벤트에 대비. 자동 응답 절차
  • 사람과 데이터의 거리 두기. 사람이 직접 데이터에 접근하지 않고 자동화된 도구로
  • 감사 추적. CloudTrail, Config

대응 서비스 #

서비스설명
AWS IAM사용자,역할,정책
AWS KMS암호화 키 관리
AWS WAF웹 애플리케이션 방화벽
AWS ShieldDDoS 방어
Amazon GuardDuty위협 탐지
AWS Secrets Manager비밀 자격증명 관리

시험 출제 패턴 #

“민감 데이터를 S3에 저장하면서 보안을 강화하려면?” → 저장 중 암호화 (encryption at rest with KMS).

“VPC 안의 인스턴스에 SSH 키 대신 안전한 접근 방법을 쓰고 싶다” → AWS Systems Manager Session Manager (Security 또는 Operational Excellence 양쪽 모두 정답 후보).

이 도메인 자체는 #4#5에서 자세히 다루겠습니다.

3) Reliability: 신뢰성 #

신뢰성은 시스템이 의도한 일을 정확하게 수행하고, 장애에서 자동으로 복구할 수 있는 능력입니다.

설계 지침 #

  • 복구 절차를 자동으로 테스트. 수동이 아니라 정기 자동 테스트
  • 수평으로 확장해 가용성 증가. 한 대의 큰 서버보다 여러 대의 작은 서버
  • 용량 추측을 멈춘다. Auto Scaling으로 자동 조정
  • 변경을 자동화. 사람의 실수 대신 코드로

대응 서비스 #

서비스설명
Auto Scaling부하에 따른 자동 증감
Elastic Load Balancing여러 인스턴스에 부하 분산
Amazon Route 53DNS 페일오버
AWS Backup통합 백업 관리
Multi-AZ deploymentRDS,EFS 등에서 가용성 향상
AWS CloudFormation재해 복구를 위한 인프라 재생성

시험 출제 패턴 #

“한 AZ가 다운되어도 서비스가 계속 동작해야 한다” → Multi-AZ 배포 (Reliability).

“트래픽이 예측 불가능해 자원이 부족할 때가 있다” → Auto Scaling (Reliability + Performance Efficiency 양쪽 후보).

Reliability vs Performance Efficiency #

이 둘이 헷갈리는 경우가 잦습니다. 단순한 구분:

  • Reliability. “장애가 나도 동작하는가?”
  • Performance Efficiency. “자원을 효율적으로 쓰는가?”

같은 Auto Scaling이라도 “장애 견디는 측면"이면 Reliability, “트래픽 증가에 비용 효율로 대응하는 측면"이면 Performance Efficiency로 분류됩니다.

4) Performance Efficiency: 성능 효율 #

자원을 효율적으로 사용해 시스템 요구사항을 충족하고, 기술이 진화함에 따라 그 효율을 유지하는 능력입니다.

설계 지침 #

  • 고급 기술의 민주화. 사용자가 직접 구축하지 않고 AWS 서비스로 활용 (예: Lambda 대신 직접 컨테이너 오케스트레이션 구축하지 않기)
  • 분 단위 글로벌 진출. 사용자에게 가까운 리전에 배포
  • 서버리스 활용. 인프라 운영 부담을 AWS로 위임
  • 자주 실험. 적절한 인스턴스 타입을 정기 재평가

대응 서비스 #

서비스설명
Amazon CloudFrontEdge 캐싱으로 응답 시간 단축
ElastiCache캐싱 (Redis/Memcached)
AWS Lambda서버리스 컴퓨팅
EC2 인스턴스 타입 선택워크로드에 맞는 패밀리(M,C,R,T)

시험 출제 패턴 #

“전 세계 사용자에게 빠른 응답 시간을 제공하려면?” → CloudFront.

“데이터베이스 응답 시간이 느려졌다, 자주 조회되는 데이터의 성능을 빠르게 하려면?” → ElastiCache.

5) Cost Optimization: 비용 최적화 #

불필요한 비용 없이 시스템을 운영하는 능력입니다.

설계 지침 #

  • 클라우드 재무 관리 (Cloud Financial Management). 비용을 지속적으로 모니터링
  • 사용량 기반 소비 모델. 필요한 만큼만
  • 전체 효율 측정. 비즈니스 결과 대비 비용
  • 차별화되지 않는 무거운 운영 부담 제거. 데이터센터 운영 같은 부분을 AWS에 위임
  • 비용을 분석,할당. 태깅으로 부서별,프로젝트별 청구

대응 서비스 #

서비스설명
AWS Cost Explorer비용 추세 시각화
AWS Budgets예산 초과 알림
AWS Trusted Advisor비용 최적화 점검
AWS Pricing Calculator사전 비용 산정
Cost and Usage Report (CUR)상세 청구 데이터
Savings Plans / Reserved Instances1~3년 약정 할인
Spot Instances최대 90% 할인

시험 출제 패턴 #

“개발 환경의 비용을 줄이고 싶다, 어떤 가격 모델이 가장 적합한가?” → Spot Instances (개발은 중단 허용).

“3년 동안 안정적으로 EC2를 운영할 예정이다, 어떤 모델이 가장 저렴한가?” → Reserved Instances 또는 Savings Plans (3년 + All Upfront이 가장 저렴).

자세한 가격 모델은 #8에서 다루겠습니다.

6) Sustainability: 지속가능성 #

2021년 12월에 추가된 6번째 원칙입니다. 워크로드의 **환경 영향(에너지 사용, 탄소 배출)**을 최소화하는 능력에 초점을 둡니다.

설계 지침 #

  • 영향 측정. 워크로드의 환경 영향을 정량화
  • 지속가능성 목표 설정. 비즈니스 KPI에 환경 지표 포함
  • 활용도 최대화. 자원 낭비를 줄임 (작은 인스턴스 여러 대보다 적절히 큰 인스턴스 하나)
  • 하드웨어 효율 추적. 새 EC2 패밀리(Graviton 등)로 마이그레이션
  • 관리형 서비스 사용. AWS의 효율적 인프라 활용
  • 다운스트림 영향 감소. 데이터 전송량 줄이기

대응 서비스 #

서비스설명
AWS Customer Carbon Footprint Tool워크로드의 탄소 배출량 시각화
AWS Graviton 인스턴스ARM 기반, 와트당 성능 우수
Spot Instances유휴 자원 활용
S3 Intelligent-Tiering자동 계층 전환으로 자원 효율

시험 출제 패턴 #

“클라우드 사용에 따른 탄소 배출을 줄이려면?” → Graviton 인스턴스로 마이그레이션 또는 유휴 자원 식별 후 정리 (Sustainability).

“기존 EC2를 더 적은 자원으로 동일한 성능을 내려면?” → Right-sizing (Sustainability + Cost Optimization 양쪽 후보).

6개 원칙의 트레이드오프 #

원칙들은 종종 서로 충돌합니다. 시험은 이 트레이드오프를 의식하고 있는지를 봅니다.

트레이드오프예시
Reliability ↔ CostMulti-AZ는 더 비싸지만 더 안정적
Performance ↔ Cost큰 인스턴스는 더 빠르지만 더 비쌈
Security ↔ Operational Excellence강한 통제는 배포 속도를 늦출 수 있음
Sustainability ↔ Performance더 작은 인스턴스는 환경에 좋지만 응답이 느릴 수 있음

시험 보기 두 개가 다 맞아 보이면 문제가 강조하는 원칙의 관점으로 답을 좁히면 됩니다.

Well-Architected Tool #

AWS Well-Architected Tool은 자신의 워크로드를 6개 원칙의 기준으로 점검하는 무료 서비스입니다. 콘솔에서 워크로드를 등록하고 질문지에 답하면 개선 권장사항이 나옵니다. 시험에서는 “Well-Architected Tool은 무엇을 위한 서비스인가?” 정도의 단순한 질문으로 출제됩니다.

Lens: Well-Architected의 변형 #

Well-Architected는 일반 워크로드용이지만, **특정 워크로드 유형을 위한 변형(Lens)**도 있습니다.

  • Serverless Lens. Lambda 기반 워크로드
  • SaaS Lens. 멀티 테넌트 SaaS
  • Machine Learning Lens. ML 워크로드
  • Financial Services Lens. 금융 서비스
  • IoT Lens. IoT 워크로드

시험에서 Lens가 직접 출제되는 빈도는 낮지만, “특수 워크로드에 Well-Architected를 적용하려면?” 보기에 등장하는 경우가 있습니다.

자주 만나는 함정 #

1) 5개 원칙으로 외우기 #

가장 흔한 실수입니다. 6개입니다. 2021년 12월에 Sustainability가 추가되었습니다. 오래된 책,블로그가 5개로 적혀 있는 경우가 많으므로 주의해야 합니다.

2) Reliability와 Availability를 같은 말로 #

Reliability는 시스템이 의도한 일을 정확히 하는 능력 + 장애 복구입니다. Availability(가용성)는 그중 일부, 즉 사용 가능한 시간 비율입니다. 시험에서 Availability는 보통 99.9% 같은 숫자로 표현됩니다.

3) Performance와 Reliability의 혼동 #

앞서 다룬 구분 기억하기:

  • Reliability = “장애가 나도 동작?”
  • Performance Efficiency = “효율적으로 자원 사용?”

4) “보안이 최우선"이라는 단순 답변 #

보기에 “Security를 최우선으로 한다"가 있다고 그게 항상 정답은 아닙니다. 문제가 강조하는 시나리오에 맞춰야 합니다. 비용 관련 문항에서 보안을 정답으로 고르면 오답.

5) Sustainability를 무시하기 #

비중이 낮아 보여 건너뛰는 응시자가 많지만, 시험에서 Sustainability를 직접 묻는 문항이 한두 개는 거의 항상 출제됩니다. 6개 원칙과 Carbon Footprint Tool 정도는 외워 둡니다.

정리 #

이번 글에서 잡은 것:

  • Well-Architected Framework는 6개 원칙. Operational Excellence / Security / Reliability / Performance Efficiency / Cost Optimization / Sustainability
  • 각 원칙은 설계 지침 + 대응 서비스 + 시험 출제 패턴으로 외운다
  • 트레이드오프. 한 원칙을 강화하면 다른 원칙이 약해질 수 있음. 시험은 그중 어느 원칙을 우선하는지 보기 선택
  • Well-Architected Tool은 자신의 워크로드를 6개 원칙 기준으로 점검하는 콘솔 서비스
  • Lens는 특수 워크로드(Serverless,SaaS,ML 등)를 위한 변형
  • 함정. 5개 원칙 외우기 / Reliability와 Availability 혼동 / Performance와 Reliability 혼동 / Security 최우선 답 함정 / Sustainability 무시

다음: Domain 2 보안 #

도메인 1이 끝났습니다. 다음은 시험 비중 30%의 가장 큰 도메인, Security and Compliance로 들어갑니다.

#4 Domain 2-1 보안: 책임 공유 모델, IAM 기초에서는 AWS와 고객의 책임이 어디서 갈리는지(서비스 모델에 따라 어떻게 달라지는지), IAM의 네 가지 핵심(사용자,그룹,역할,정책), MFA, 그리고 시험에서 자주 함정으로 나오는 root 사용자 운영 가이드까지 정리하겠습니다.

X