DevOps

DevOps 업무

팅리엔 2022. 7. 5. 15:24

목표

  • 지속적 통합 Continuous Integration
  • 지속적 배포 Continuous Delivery
  • 마이크로서비스 Micro-services
  • IaC (Infrastructure as Code)
  • 모니터링과 로깅 Monitoring & Logging
  • 소통 및 협업 Communication & Collaboration

 

데브옵스 엔지니어의 역할

조직에 데브옵스 문화를 정착시키는 환경을 만들어준다.

(개발자가 개발 뿐만 아니라 운영에도 참여할 수 있는 환경을 만들어준다. 주요 고객이 바로 개발자!)

 

 

데브옵스 팀의 업무 도메인

  • 네트워크 Network
    • 가상 네트워크 및 물리 네트워크 구성
    • 프록시 / VPN 서버 운영
    • DNS 서버 운영
  • 개발 및 배포 플랫폼 Development & Deployment Platform
    • GitLab / GitHub 와 같은 버전관리 및 개발 협업 플랫폼 운영
    • CI/CD 파이프라인 시스템 구축 및 운영
    • QA 테스트 및 성능 테스트를 위한 환경 제공
    • 패키지 저장소 운영 및 배포 산출물 관리
  • 오케스트레이션 플랫폼 Orchestration Platform
    • 쿠버네티스 / ECS / Nomad 와 같은 오케스트레이션 시스템 구축 및 운영
    • Airflow / Argo Workflows 와 같은 워크플로우 엔진 구축 및 운영
  • 관측 플랫폼 Observability Platform
    • 로그 / 메트릭 / 업타임 / APM 정보를 관측할 수 있는 중앙화된 시스템 구축 및 운영
    • 주요 이벤트에 대한 알림 시스템 구축
  • 클라우드 플랫폼 Cloud Platform
    • 개발자들이 활용할 수 있도록 클라우드 환경 운영
  • 보안 플랫폼 Security Platform
    • LDAP / AD / SAML 등을 활용하여 통합된 임직원 계정계 운영
    • 서버 및 데이터베이스 접근제어 시스템 구축 및 운영
    • 네트워크 방화벽 정책 관리
  • 데이터 플랫폼 Data Platform
    • MySQL / DynamoDB / Redis 와 같은 데이터베이스 구축 및 운영
    • RabbitMQ / Kafka / SQS 와 같은 메시징 서비스 구축 및 운영
    • 데이터 웨어하우스 / BI 대시보드 구축 및 운영
  • 서비스 운영 Service Operations 
    • 개발자들과 협업하여 서비스 공동 운영

 

/

 

  • 구축 Provisioning
  • 설정 Configuration
  • 운영 Operation
  • 사용 Usage
  • 교육 Training
  • 문서화 Documentation

 

 

데브옵스 팀의 핵심 지표

  • 장애 복구 시간 MTTR (Mean Time To Recovery)
    • 얼마나 빠르게 장애 상황에서 복구할 수 있는가?
  • 변경으로 인한 결함률 (Change Fatilure Rate)
    • 얼마나 자주 변경 사항으로 인하여 장애가 발생하는가?
  • 배포 빈도 (Deployment Frequency)
    • 배포를 얼마나 자주 하는가?
  • 변경 적용 소요 시간 (Lead Time for Changes)
    • 변경 사항에 프로덕션 배포에 걸리는 소요 시간은 얼마인가?

 

 

데브옵스 엔지니어의 성장