데이터 마트의 정의
데이터 마트는 조직의 사업부와 관련된 정보를 포함하는 데이터 스토리지 시스템입니다. 여기에는 회사가 더 큰 스토리지 시스템에 저장하는 데이터의 일부만 포함됩니다. 데이터 마트를 사용해 데이터에 빠르게 액세스하고, 인사이트를 신속하게 얻을 수 있습니다. 기업은 데이터 마트를 사용하여 부서별 정보를 보다 효율적으로 분석합니다. 복잡한 데이터 웨어하우스 또는 다양한 소스로부터 수동으로 집계된 데이터 내에서 원하는 데이터를 탐색하는 시간을 줄여줍니다.
데이터 마트가 중요한 이유
👉 효율적인 데이터 검색
기업은 데이터 마트를 사용하여 특정 정보에 보다 효율적으로 액세스할 수 있습니다. 데이터 마트에는 부서에서 자주 액세스하는 관련 세부 정보가 포함되어 있습니다. 따라서 비즈니스 관리자는 성과 보고서 또는 그래픽을 생성하기 위해 전체 데이터 웨어하우스를 검색할 필요가 없습니다.
👉 의사 결정 간소화
기업은 데이터 마트를 사용하여 데이터 웨어하우스에서 데이터의 하위 세트를 만들 수 있습니다. 그러면 부서 내의 직원이 데이터를 분석하고 동일한 정보 세트를 기반으로 결정을 내릴 수 있습니다.
👉 효과적인 정보 제어
데이터 마트는 직원들에게 매우 세분화된 액세스 권한을 제공합니다. 즉, 회사는 특정 사용자에게 특정 데이터를 보거나 검색할 수 있는 권한을 부여할 수 있습니다. 이는 기업이 데이터 거버넌스를 개선하고 정보 액세스 정책을 시행하는 데 도움이 됩니다. 예를 들어, 데이터 마트를 사용하여 데이터 웨어하우스의 특정 정보에 대한 사용자 액세스를 직원에게 제공할 수 있습니다.
👉 유연한 데이터 관리
데이터 마트는 데이터 웨어하우스보다 더 작고 테이블 수가 적습니다. 즉, 데이터 엔지니어가 주요 데이터베이스 변경 없이 데이터 마트에서 정보를 관리하고 변경할 수 있습니다.
👉 민첩하고 확장 가능한 데이터 관리 구현
데이터 마트는 과거 프로젝트에서 수집한 정보를 현재 작업을 지원하는 데 활용할 수 있게 하는 등 비즈니스 요구 사항에 맞는 민첩한 데이터 관리 시스템을 제공합니다. 팀은 신규 분석 프로젝트 및 진행 중인 분석 프로젝트를 기반으로 데이터 마트를 업데이트 및 변경할 수 있습니다.
데이터 마트, 데이터 레이크 및 데이터 웨어하우스의 차이점
데이터 웨어하우스
데이터 웨어하우스는 기업 전체에 대한 비즈니스 인텔리전스 및 분석을 지원하도록 설계된 데이터 관리 시스템입니다. 데이터 웨어하우스에는 보통 기록 데이터를 포함한 방대한 데이터가 담겨있죠. 일반적으로 데이터 웨어하우스 내에 저장된 데이터는 애플리케이션 로그 파일, 트랜잭션 애플리케이션 등 광범위한 소스로부터 추출된 것들입니다. 데이터 웨어하우스는 보통의 경우 그 목적이 명확히 정의된, 구조화된 데이터를 보관합니다.
데이터 마트와 데이터 웨어하우스 비교
데이터 마트는 데이터 웨어하우스의 많은 특성을 공유합니다.
차이점은 데이터 웨어하우스에는 다양한 주제에 대한 전사적 데이터가 포함되어 있다는 것입니다. 한편 데이터 마트는 특정 주제와 밀접하게 관련된 정보를 저장합니다.
예를 들어, 데이터 웨어하우스는 마케팅, 인사, 조달 및 고객 지원 부서에 대한 정보를 저장할 수 있습니다. 그러나 데이터 마트는 단일 부서와 관련된 트랜잭션 데이터만 저장할 수 있습니다. 데이터 마트 빌드의 매력은 데이터 마트를 관리하는 부서가 데이터 로드 및 관리를 완전히 제어할 수 있다는 것입니다.
데이터 레이크
원시 및 비정형 정보를 보관하는 데이터 스토리지로서 파일과 폴더에는 정보를 저장하지 않습니다. 대신 처리되지 않은 정보를 대규모 스토리지의 플랫 계층 구조에 저장합니다. 데이터 레이크는 텍스트 문서, 이미지, 비디오, 오디오 등 다양한 유형의 원시 정보를 저장합니다. 데이터 분석가는 데이터 레이크를 사용하여 비정형 데이터에서 예측 분석을 수행합니다. 예를 들어, 데이터 레이크는 기업이 감정 분석에 사용할 수 있는 소셜 미디어 리뷰의 텍스트를 저장할 수 있습니다. 데이터 분석가는 감정 분석을 사용하여 회사에 대한 부정적인 의견 추세를 감지할 수 있습니다.
데이터 레이크와 데이터 웨어하우스의 주된 차이점
데이터 레이크에는 사전 정의된 구조 없이 방대한 양의 원시 데이터가 그대로 저장된되지만 데이터 웨어하우스에서는 명확히 정의된 구조화된 데이터를 보관합니다.
데이터 마트와 데이터 레이크 비교
데이터 레이크는 처리되지 않은 데이터를 저장하기 때문에 일부 정보는 중복되거나 회사에 의미가 없을 수 있습니다. 한편, 데이터 마트는 특정 요구에 맞는 처리된 데이터를 저장합니다. 데이터 레이크는 데이터 마트의 소스가 될 수 있습니다. 기업은 데이터 마트의 기록 데이터를 보고 데이터 추세를 결정하지만 데이터 레이크를 사용하여 저장된 정보를 심층적으로 분석합니다.
출처 : https://www.oracle.com/kr/autonomous-database/what-is-data-mart/ ,https://aws.amazon.com/ko/what-is/data-mart/
'DEV > DB' 카테고리의 다른 글
쿼리 성능 높이는 법 (3) | 2024.10.22 |
---|---|
[SQL] 열을 행으로 바꾸는 방법 정리, CONECT BY LEVEL/UNION ALL/UNPIVOT (0) | 2023.03.29 |
Postgresql 공백제거(TRIM, REGEXP_REPLACE) (0) | 2022.07.12 |
[MySQL] JOIN 하기 (0) | 2020.08.04 |
[MySQL] DATETIME 가공하기 (1) | 2020.08.03 |
댓글