관계형데이터모데링노트 요약

데이터 통합(일반화/상세화)

mitomi 2023. 10. 23. 16:26
반응형
SMALL

1. 일반화/상세화

모델링에서 일반화한다는 것 

데이터통합을 의미(일반화: 유사한것을 묶는것)

일반화하면 자연히 묶이게 되고 통합하게됨

상세한 (개별적인)것에서 출발해 일반적인 것으로 만드는방법 상향식방법(자연인,법인-->고객으로 일반화)

상세화,특수화,차별화 한다는것

하향식 방법으로 차이를 도출하는것(고객 --> 자연인 고객, 법인고객)

구체적을 따져 다른점강조

두리뭉실한 개념에서 구체적인 개념으로 만드는것

엔터티를 일반화 하거나 상세화 하면 슈퍼타입와 서버타입이 생김

데이터 통합과 일반화, 서브타입은 연관된 개념

일반화와 상세화 모두 결국은 차이를 보이기 위한 것

 

2.통합 시 주의할 점

- 성능   

데이터 통합하면 데이터는 증가할수 밖에 없음.

데이터 증가와 성능은 상관관계가 있기에 주의를 살펴야 함.

 insert가 많은 엔터티에 엔터티 통합하는 것은 바람직하지 않다.

 

- 정체성 희석   

지나친 일반화는 데이터 정체성을 희석시킨다. 

유사하지 않은 데이터인데 유사하게 선언한 후에 통합, 의도하지 않은 통합,스스로도 잘 모르는 통합, 통합을 위한  통합을 하지 않기 위해서는  데이터정의를 제대로!!!

다양한 기준에 의해 분류(실체, 행위, 기준, 가공) 할때 다른분류의 엔터티간의 통합이 발생하면  데이터정체성이 희석됨

실체와 행위, 실체와 가공,기준과 행위 데이터가 합쳐진  엔터티를 쉽게 찾을 수 있음-->(1:1관계가 많이 발생)

고객(실체) 출생신고(행위) 1:1 관계 합쳐서 많이 사용.---> 분리하는 것이 바람직?그래야 데이터정의가 명확해짐

 

 - 무결성 저하 

데이터 통합하면 데이터 무결성이 저하될수 있음. (제약조건, 도메인, Not null제약 생성하지 못하는 것)

·  Not null 제약

ex) 고객 엔터티

주민번호 식별번호를 고객식별번호로 사용시 외국인인경우 외국인번호가 없는 경우 Not null제약 생성할 수 없음

배타관계 : 배타관계가 발생한 속성일 경우 어떤관계는 존재하지 않을 수 있기 때문에 관계속성에  null 허용해여함

데이터 길이 및  데이터 타입이 다른 속성을 하나의 속성을 관리할수 있어 도메인이 달라질 수 있음

 - 마이그레이션 가능 여부

 

3. 통합 가능한 경우(무엇을 통합하느냐?)

-   데이터 성격이 유사할때(실체를 관리하는 데이터중에서 데이터의 본질이 유사한 경우)

    데이터 성격은 유사한데 업무에서 같이 사용하지 않는다는 이유로 통합하지 않을 이유는 없음.

    데이터가 비슷하면 업무가 다를 수 없다는것! 업무 프로세스만 다를뿐 데이터의 성격이 같다면 가능한 통합

-  엔터티의 기초속성이 유사할때

    엔터티에서 관리하는 데이터의 본질이 속성으로나타남. 속성이 유사하면   본질이 유사할 가능성 높음

     기초속성이 유사하면 통합고려

- 데이터가 조회 등에 같이 사용될 때

   데이터를 같이 사용하는지 여부,데이터를 같이 본다는 측면이 통합하는 명분이 됨

   고객 연락처 : 이메인,홈페이지, 메신저,전화번호

- 역활을 관리할 때(계좌관리사원,계좌유치사원,계좌주문사원)

- 대칭적인 업무일때(매입/매출 전표,입고/출고)

- 계층관계 존재할때(본사/부서/팀)

- 공통속성이 존재할때(공통속성만 분리해서 통합고려)

- 배타관계 존재할때

- 집계 엔터티의 집계대상, 집계하려는 내용이 집계기준 고려하여 통합검토

- 비정규화 수행할때 (성능문제가 발생한다면) 주문-주만상품(주문상품엔터티에 주문엔터티의 속성을 중복 관리)

- 일대일 관계일때

   두 데이터성격이 같은지 검토/관계비가 불변인지 검토       

- 유사한 종류의 데이터를 하나의 기준으로 만들때(전사 우편번호 엔티티, 환율,금리 등)

   기준데이터를 여러개 갖고 있다면 데이터 정합성  떨어짐, 업무 혼선, 무결성 품질 저하를 가져옴

- 업무가 변경될 가능성이 많을때

   

4. 통합을 고려하지 않아도 되는 경우

- 엔터티가 같이 조회되지 않는다면 통합을 고려하지 않을 수 있음(정보계시스템을 포함)

 (ef.  같이조회된다는 것 -> union 구문 사용 -> 통합고려)

- 유사한 종류의 엔터티가 향후에도 늘어나지 않을 때

  (데이터가 늘어나지 않는 다는 것 -> 데이터가 상호 배타적이며, 그합이 전체라는 뜻)

- 유사한 하위 엔터티가 없을 때도 통합을 고려하지 않아도 됨

  (유사한 하위 엔터티가 많다면 상위 엔터티로 통합하야함)

*사용하는 조직이 다르거나 업무 프로세스가 다르다고  통합기준으로 둬선 안됌

 ex) 내국인/외국인, 우리회사상품/타사 상품을  별로로 관리하진 않음

                         

                                                 

 

728x90

'관계형데이터모데링노트 요약' 카테고리의 다른 글

데이터 통합과 합체  (0) 2023.10.28
데이터 주제 영역  (1) 2023.10.27
정규화 요약  (1) 2023.10.22
5정규형  (0) 2023.10.22
4정규형  (1) 2023.10.22