CS 내용 요약, 지식/Google Cloud Associate

Google Cloud Associate 강의 요약: storage

걍판자 2025. 1. 3. 23:38
반응형
  • 블럭스토리지 vs 파일스토리지
    • 하드디스크는 블록이라는 고정 큰위 단위로 저장되기에 블록스토리지. 계층형으로 공유하기 남들가 공유하기 위해서는 파일 스토리지
  • 블럭 스토리지
    • 너 컴퓨터의 하드디스크가 블럭스토리지
    • 하나의 블럭 스토리지는 하나의 가상 서버에만 연결 가능
    • 예외적으로 읽기전용 블록스토리지만 추가하여 여러개의 블럭스토리지를 하나의 가상서버에 연결 가능
    • 예시
      • DAS: 하드디스크와 비슷하게 direct-attached storage
      • SAN: 높은 속도로 네트워크 연결해 저장된 디바이스 풀 활용 storage area network
  • 파일 스토리지
    • 대용량 미디어 흐름, 비디오 편집 같은거, 회사에서 안전하게 파일 공유할때
    • 다양한 여러개의 virtual server와 공유 가능
  • GCP 에서
    • 블럭 스토리지:
      1. persistent Disks(PD)
        • vm instance에 network drive로 결합시키는 network block storage임
        • 하나의 zone에서만 복제본 두면 zonal, 다양한 zone에 복제본 두면 regional
        • 더 튼튼함.
        • 미리 얼마의 capactiy를 할당할지 정해야 함.
        • 매우 유연함. 사이즈의 크기를 너가 필요한 만큼 늘릴 수 있음. 성능또한 이 사이즈에 좌우됨
        • lifecycle이 vm 인스턴스에 묶이지 않아 vm 인스턴스 다른것과 탈부착 가능
        • custom database를 작동시킬떄 적당함
        • snapshot 지원
        • local ssd 보다는 IO speed 느림
        • 영구 저장소
      2. local SSD
        • 일시적인 storage라 일시적인 데이터임. running할때만 데이터 지속됨. 데이터 유지하고 싶으면 live mirgation 하길..
        • lifecycle이 vm 인스턴스에 묶임
        • 물리적으로 vm 인스턴스와 묶여있어 따로 붙였다 떼었다 다른거랑 연결하는거 안됨
        • 입출력(IOPS) 빠르고, 지연율 낮음
        • 데이터 자동으로 암호화 됨. 근데 암호화 키를 구성할 수는 없음
        • 오직 일부의 machine type만 local SSD 지원
        • SCSl과 NVMe라는 인터페이스 지원, 얘네 이미지를 써야지 성능 가장 좋음
        • SSD와 vCPU(vm의) 커지면 성능 좋아짐
        • snapshot 미지원
    • 파일 스토리지: Firestore: 파일 저장 성능 높음
      • NFSv3 프로토콜 지원하며 capacity 미리 정해놓아야 함
      • workload에 고성능 보임
      • HDD와 SSD 지원
      • 파일 공유나, 미디어 워크폴로우, 콘텐츠 관리에 쓰임
  • persistent disk의 3가지 종류
  standard Balanced SSD
underlying storage 하드 디스크 드라이브 solid state drive solid state drive
referred to as pr-standard pd-balanced pd-ssd
순차 작업 성능(big data/batch) good good very good
랜덤 작업 성능(transactional apps) bad good very good
cost 중간 비쌈
use cases big data(비용상 효율적) 중간 고성능
- Persistent disks- snapshots      
- 특정 시간의 persistent disk 상태를 저장하는 snapshot을 찍을 수 있다.      
- snapshot도 스케쥴링이 가능하다.      
- snapshot이 multi-regional 일수도 regional일수도 있다.      
- snapshots을 프로젝트 넘어 공유할 수 있다.      
- snapshot으로 새로운 디스크와 인스턴스를 생성할 수 있다.      
- snapshot은 갈수록 증가한다. 그러니까 두번째 스냅샷은 첫번째 스냅샷에서의 변화량을 포험한다. 다른 snapshot에 저장되어 쓸모없는 내용은 지워라      
- persistent disk에 비슷한 정보를 저장할 수 있다. 운영체제와, 영구적 데이터, 불안정 데이터를 분리하라. 여러개 디스크를 추가하는 식으로 관리하는 것을 추천      
- 1시간에 1개 이상의 snapshot을 찍지 마라.      
- snapshot은 performance를 감소시키므로 peaktime이 아닐때 해라      
- snapshot 찍는게 이미지 만드는 것보다 빠르다. 하지만 disk 생성시 이미지를 바탕으로 하는 게 스냅샷을 바탕으로 하는 것보다 빠르다. 그러니 반복적으로 디스크를 생성해야 할때만 snapshot이용하는게 좋다.      
- 머신 이미지      
- 머신 이미지는 이미지와 다르다.      
- 이미지는 부팅 persistent disk 에서 만들어지지만 machine image는 Vm 인스턴스에서 만들어진다.      
- 즉 머신이미지는 vm 인스턴스 생성에 필요한 모든 것: 구성, metadata, permission, 한개 이상의 데이터가 든 디스크      
- 인스턴스 복제를 위해 쓰기 좋다.      
- 비교      
  machine image pd snapshot custom image instance template
single disk backup X
multiple disk backup X X X
differential backup X X
instance cloning, replication X
vm instance configuration X X
- 명령어: gcloud compute disks list/create/delete/resize/snapshot 으로 설정 가능        
  • image 관련 명령어
    gcloud compute images create/delete/deprecate/describe/export/import/list/update
  • 시나리오들
    • Q: PD의 성능 증가
    • A: PD의 크기를 늘리거나 추가하기
    • Q: PD의 안정성 증가
    • A: regional PD로 설정, 2배가량 비싸나 구역을 2개로 나누기 가능
    • Q: 장애 대비를 위해 시간마다 백업 원함
    • A: 시간마다 snapshot 스케쥴링
    • Q: 스케쥴링으로 찍어둔 옛날 스냅샷 삭제 원함
    • A: 스냅샷 스케쥴링할때 구성하기
  • global, regional, zonal resources
    • global : images, snapshots, instance templates
    • regional: regional managed instance groups., regional persistent disks
    • zonal: zonal managed instacne groups, instances, persistend disks
  • 스토리지 시나리오들
    • Q: 높은 IOPS와 안정성 둘다 원한다
    • A: local SSDs
    • Q: GCP에서 높은 성능의 파일 공유 시스템을 여러 vm에 부착하길 원한다
    • A:filestore
    • Q: 모든 persistent disks와 결합된 vm 구성을 백업하길 원한다.
    • A: machine image 생성
    • Q: haredened os와 customized sw를 쉽게 vm에 론칭하고 십다
    • A: custom image 생성
반응형