자격증/SQLD

SQLD 요약 - (1) 데이터 모델링의 이해

땅콩둘기 2021. 5. 24. 10:17
반응형

모델링 특징

추상화  현실세계, 다양한 현상 일정한 양식인 표기법에 의해 표현
단순화  복잡한 현실세계를 약속된 규약 의해 제한된 표기법이나 언어로 표현
명확화  누구나 이해하기 쉽게 대상에 대한 애매모호함을 제거

모델링의 세 가지 관점

✔ 데이터 관점: 업무가 어떤 데이터와 관련이 있는지, 데이터간 관계 무엇인지 (What, Data)

✔ 프로세스 관점: 업무가 실제하고 있는 일 무엇인지, 무엇을 해야하는지 (How, Process)

✔ 상관 관점 : 업무 처리하는 방법에 따라 데이터 어떻게 영향 받고 있는지 (Interaction)

데이터 모델링 정의

정보시스템 구축 위한 데이터 관점의 업무 분석기법으로 현실세계 데이터에 대해 약속된 표기법에 의 해 표현하는 과정이고 데이터베이스 구축하기 위한 분석, 설계과정이다.

데이터모델링 기능 

명세화, 구조화, 문서화, 다양한 관점, 상세수준 표현

데이터 모델링의 유의점 

중복 , 비유연성, 비일관성

데이터 모델링 중요성

⭐ 파급효과가 크다(Leverage)

⭐ 복잡한 정보 요구사항의 간결한 표현(Conciseness)

⭐ 데이터 품질을 유지 (Data Quality)

데이터 모델링의 3단계 진행

(추상적)개념적 -> 논리적 -> 물리적(구체적)

1️⃣ 개념적 데이터 모델링(in 계획분석단계) : 추상화, 업무중심적, 포괄적, 전사적, EA수립시 사용

2️⃣ 논리적 데이터 모델링(in 분석단계) : KEY, 속성, 관계 표현. 재사용성 높음 (정규화)

3️⃣ 물리적 데이터 모델링(in 설계단계) : 실제 데이터베이스 이식할 수 있도록 성능,저장 등 물리적 성격 고려

데이터 모델링 세가지 요소 

💡 어떤 것(Thing) - 엔티티(Entity) , 속성(Attribute), 관계(Relationships)

좋은 데이터 모델의 요소 

완정성, 중복배제, 업무규칙, 데이터 재사용, 의사소통, 통합성

데이터 모델에 표시할 요소

✔ 구조(Structure) : 논리적으로 표현된 개체 타입들 간의 관계, 데이터 구조 및 정적 성질을 표현

✔ 연산(Operation) : 데이터베이스에 저장된 실제 데이터를 처리하는 작업에 대한 명세, 데이터베이스를 조작하는 기본도구

✔ 제약조건(Constraint) : 데이터베이스에 저장될 수 있는 실제 데이터의 논리적인 제약 조건

데이터 독립성 요소

🔥 외부 스키마 : 개개 사용자가 보는 개인적 DB 스키마

🔥 개념 스키마 : 모든 사용자 관점을 통합한 전체 DB

🔥 내부 스키마 : 물리적 장치에서 데이터가 실제적 저장

데이터 독립성 필요 이유

유지보수 비용증가, 데이터 중복성, 복잡성 증가, 요구사항 대응 저하

ANSI / SPARC 3단계 구조

✔ 논리적 독립성(외부단계-개념적단계) : 개념적스키마 변경, 외부스키마 영향 없음. 논리적 구조 변 경되어도 응용프로그램 영향 없음

✔ 물리적 독립성(개념적단계-내부적단계) : 내부스키마 변경, 외부/개념스키마 영향 없음. 저장장치의 구조변경은 응용프로그램과 개념스키마에 영향없음


개체(Entity)의 개념 

💡 데이터베이스에 표현하기 위한 어떤 것(Thing)

개체(Entity)의 특징

업무에서 필요한 정보, 식별이 가능해야 함, 인스턴스의 집합(두개이상), 속성을 포함하고 관계가 존재

개체(Entity)의 분류

💥 유무형

     -유형 : 물리적인 형태, 안정적 (사원, 물품, 강사)

     -개념 : 물리적 형태 존재하지 않고 관리해야 할 개념적 정보 (조직, 보험상품)

     -사건 : 업무 수행함에 따라 발생됨 (주문, 청구, 미납)

💥 발생시점 (기본->중심-> 행위)

    -기본 : 원래 존재하는 정보. 독립적으로 생성 가능. (사원, 부서, 고객)

    -중심 : 기본엔터티로부터 발생되고 업무에 있어서 중심적인 역할 ( 계약, 접수)

    -행위 : 두 개 이상의 부모엔터티로부터 발생되고 자주 내용 바뀌거나 데이터 양 증가(주문내역, 계약진행)

속성(Attribute)의 개념

💡 데이터의 가장 작은 논리적 단위, 개체를 구성하는 항목, 파일 구조상의 데이터 항목

속성(Attribute)의 분류

✔ 기본속성(업무로부터 추출한 모든 속성_원래속성)

✔ 설계 속성 (코드성 속성, 1:1치환), 파생 속성(계산된 값)

인스턴스 - 속성 - 엔터티 의 관계

인스턴스 2개 이상 엔터티, 2개 이상 속성을 엔터티는 가짐, 1:1 (속성 : 속성값)

도메인(Domain)의 정의

각 속성이 가질 수 있는 값의 범위

관계(Relationships)의 개념

💡 개체간의 관계 또는 속성간의 관계

엔티티의 인스턴스사이의 논리적인 연관성 존재(페어링) -> 페어링의 집합이 관계(Relation)

관계(Relationships) 표기법

관계명(Membership), 관계차수(Cardinality), 관계선택사양(Optionality_필수관계, 선택관계 )

관계(Relationships) 체크사항

연관규칙 존재, 엔터티 사이 정보 조합이 발생, 관계연결에 대한 규칙 서술, 관계연결 가능하게 하는 동사


식별자 정의

엔터티 내에서 인스턴스를 구분하는 구분자

식별자 분류

➡ 대표성 여부(주식별자/보조식별자)

➡ 스스로 생성 여부(내부식별자/외부식별자)

➡ 속성의 수 (단일식별자/복합식별자)

➡ 대체 여부(본질식별자/인조식별자)

식별자의 특징

유일성, 희소성, 불변성, 존재성

비식별자 정의

부모 속성을 자식의 일반 속성으로 사용

식별자/ 비식별자 관계 (상속여부가 Key Point)

✔ 식별자 관계 : 부모로부터 받은 식별자를 자신엔터티의 주식별자로 이용 ( 강한 연결관계, 실선표 현)

✔ 비식별자 관계 : 부모로부터 속성 받았지만 일반속성으로 사용 (약한 연결관계, 점선 표현)

비식별자 관계 설정 고려사항 

관계분석(부모 없는 자식이 생성될 수 있는 경우) -> 관계의 강/약 분석(약) -> 자식테이블 독립PK필요(필요) -> SQL 복잡도 증가 (비식별자) 식별자 관계설정 고려사항 : 강한관계, 주식별자 PK사용

반응형