CS 내용 요약, 지식/Google Cloud Associate

Google Cloud associate 강의 요약: Cloud monitoring

걍판자 2025. 1. 21. 17:34
반응형

Cloud monitoring

  • 효과적으로 운영하기 위한 도구로 Metrics에서는 각종 지표들을, Graphs and dashboard에서는 각종 시각화를, Configure Alerts 에서는 건강하지 않은 상황일때 알림이나 문서 상태를 바탕으로 경고정책을 짤 수 있다.
  • Workspace로 여러 계정이나 GCP 프로젝트의 정보를 모아서 볼 수 있다.
  • 가상머신에서는 CPU,disk, network,uptime 등의 정보를 받아올 수 있다. Cloud monitoring agent를 VM 에 설치하면 더 많은 정보를 얻을 수 있다.

Cloud Logging

  • 로그를 남겨주는 도구로 exabyte 스케일로 작동한다. 주요 기능으로는
    • Logs explorer: 유동적인 쿼리를 분석 정렬 탐색함
    • Logs dashboard: 시각화
    • Logs Metrics: 각종 측정 항목들을 log로 부터 캡쳐함
    • Logs Router: 로그 증가하는 걸 볼 수 있고 다른 목적지로 라우팅 가능
  • GKE, App Engine, Cloud Run 등의 도구로도 자동으로 로그를 보낼 수 있다.
  • GCE의 가상머신에서 로그를 보내려면 Logging Agent를 설치하고 실행하면 된다.
  • on-premise의 경우 Blue Medora의 BindPlane이나 Cloud logging API를 사용하면 된다.

Audit log

  • Access Transparency log: 모든 서비스에서 지원되지는 않지만 GCP 팀에서 너의 컨텐츠에 접근한 행동들에 대해 capture한다. gold support level 이상의 조직에서만 지원한다.
  • Cloud Audit logs: 누가어떤 서비스에서 어떤 작업을, 어떤 리소스가 감사받았는지 나온다.
Feature Admin 활동 로그 데이터 접근 로그 시스템 이벤트 로그 정책 위반 로그
API 호출이나 다른 기능들이 조정된 리소스 구성 리소스의 구성 읽기 구글 클라우드 관리 작업 활동 유저나 서비스 계정이 접근이 거부될때
Default Enabled yes no yes yes
VM Examples vm 생성, 리소스 업데이트, IAM 권한 변경 Vm이나 image의 리소스 listing host 유지관리, 인스턴스 preemption, 자동 재시작 안전 정책 위반 로그
Cloud Storage bucket이나 object 수정 bucket이나 object 읽고 수정
Access Needed 로깅/로그 뷰어 나 project/viewer 로깅/private 로그 뷰어 나 project/owner
(얘만 다름!)
로깅/로그 뷰어 나 project/viewer 로깅/로그 뷰어 나 project/viewer

Cloud Logging - controlling & routing

  • log는 다양한 소스에서 log Router에 라우팅된다. 그리고 log router는 configured rules로 도달한 로그들을 확인한다.
  • 2가지 타입의 logs bucket이 있다 required와 default이다.
    • Required: admin activity, system events, access transparency logs 를 남기며 400일간 유지된다. 비용 없고 삭제도 불가능 하며, 보관 기간을 변경할 수 없다.
    • default: 그 외의 다른 로그들을 남기며 30일간 보관되고 비용이 청구된다. bucket을 삭제할 수 없는건 마찬가지이지만 bucket에서 로그 남기는 것 비활성화 가능, 유지 날짜 편집 가능
  • 로그들은 제한된 기간동완 보관되며 이를 export 할 수 있다. 오랜기간 보관을 원한다면 cloud storage bucket, big query dataset, cloud pub/sub topic등으로 export 할 수 있다. 또한 포함, 제외를 정하는 필터를 통해 로그 export를 조절할 수 있다.

Cloud Trace

  • GCP의 분산 추적 시스템, 구글 클라우드 서비스에서 제공하며 다양한 어플리케이션에서 추적하는 서비스. Cloud Trace API를 활용함
  • 얼마나 서비스가 요청하는데 걸리는지 평균지연율이 어떻게 되는지 등을 추적 가능함. Compute Engine, GKE, App Engine 등에서 지원하며 C#, Go, Java, Node.js, Python, Ruby 등의 언어를 사용가능함

Cloud Debugger

  • test나 production 환경에서 디버깅 이슈를 찾을떄 활용할 수 있다.
  • 실행중인 응용 프로그램을 캡쳐하고 콜스텍, 변수 스냅샷, 호출스택 등을 알 수 있다. 매우 가볍고 어느 환경에서든 사용가능하며 재배포가 필요없어서 좋다.

Cloud Profiler

  • 병목혁상 식별을 위한 도구로 토계적으로 low-overhead profiler를 제공한다.지속적으로 CPU와 memory 사용 을 모으고, 프로파일링 데이터와 소스코드를 연결시킨다. 즉 병목현상을 극복할 수 있다.
  • 2가지 profiling agent(정보수집)와 profiler interface(시각화,오버헤드 낮음)로 구성된다.

Error Reporting

  • 실시간으로 production problem을 구별하는 방법
  • 에러 track으로 쌓이는 거 볼 수 있고 중앙집중화된 에러 관리, firebase crash reporting으로 appclient 에서 일어난 일들을 볼 수 있다.

시나리오

  • Q: 모든 object와 bucket에서 나온 모든 operations, requests를 기록할 수 있다.
  • A: data ccess audit logging을 bucket에 올리면 된다.
  • Q: 다양한 microservice에서 추적 원함
  • A: Cloud Trace
  • Q: 특정 mircroservice에 exception, error 식별
  • A: Error Reporting
  • Q: 차근차근 production에서 문제 디버깅
  • A: Cloud Debugger
  • Q: 특정 request에서 log 보기
  • A: Cloud logging
반응형