Skip to main content

[Tech 017] Google Cloud BigQuery와 Cloud DLP(Cloud Data Loss Prevention) 활용하기

안녕하세요, 클루커스 구글 클라우드 컨설턴트 엄수민, 박보련, 오지수입니다.

Cloud DLP(Cloud Data Loss Prevention)란 개인 식별 정보(PII)와 같은 민감한 정보를 대규모로 식별하고 보호할 수 있는 Google Cloud의 완전 관리형 서비스입니다.

Cloud DLP를 활용하면 Cloud Storage, Datastore, BigQuery를 스캔하여 민감 정보를 감지하고, 해당 정보의 저장 위치와 데이터의 유형, 사용되는 방법을 식별 가능합니다.
조직 전반에서 Cloud DLP 검사를 지속적으로 실행할 경우, BigQuery에 새 테이블 데이터가 추가될 때 자동으로 데이터 프로파일링을 실행하여 사용자는 비즈니스에 집중할 수 있는 환경에서 더욱 높은 성과를 얻을 수 있습니다.

검사 결과는 Security Command Center, Data Catalog 및 자체 SIEM등에도 활용이 가능한데요,
예를 들어 데이터에 대한 접근 제어 및 공유 권한의 적절한 정책 기준이 될 수 있고, 민감 정보를 지속적으로 모니터링하므로 데이터 관리의 가시성도 확보할 수 있습니다.

더불어, Cloud DLP의 150개가 넘는 사전 정의된 감지기를 활용하면 별도 프로그래밍을 통한 로직 작성 없이 민감 정보의 패턴, 형식 등을 식별할 수 있고, 데이터의 복제 없이도 마스킹, 토큰화, 가명처리 등의 데이터 익명화까지 수행이 가능합니다.

이번 데모영상에서는 GCP 콘솔에서 Cloud DLP 검사 템플릿을 만들고, 생성한 템플릿을 활용해 BigQuery에 저장된 민감 정보를 스캔하고 분석하는 법에 대해 알아보겠습니다.

 

데모에서 사전 준비 된 사항

데이터 프로세싱에 사용할 원본 BigQuery Table

꼭 알아둬야 할 Cloud DLP Tip!
Cloud DLP는 검사한 용량 당 과금되는 방식으로, 샘플링을 통해 검사할 데이터의 양을 줄여 비용 효율적으로 진행할 수 있습니다.
지속적으로 검사를 수행하는 Automatic Cloud DLP가 궁금하다면, 여기를 참고해주세요.

Reference
https://cloud.google.com/dlp/docs/schedule-inspection-scan?hl=ko

데모에서 사전 준비 된 사항

데이터 프로세싱에 사용할 원본 BigQuery Table

본 데모에서 꼭 알아둬야 할 Dataplex Tip!
  • Cloud DLP는 검사한 용량 당 과금되는 방식으로, 샘플링을 통해 검사할 데이터의 양을 줄여 비용 효율적으로 진행할 수 있습니다.
    지속적으로 검사를 수행하는 Automatic Cloud DLP가 궁금하다면, 여기를 참고해주세요.
Secured By miniOrange