전체 글 99

한 엔터티에 여러개 서브타입 존재시

한 엔터티에 서브타입 후보가 여러개 존재할때는 그집합을 가장 잘 표현하는 한개만 존재하도록 해야 함 한 엔터티에 서브타입이 여러개인 이유 - 첫번째 집합을 나누는 관점에 때라 다양한 뷰 존재 특정집합은 기준이 무엇이냐에 따라 여러가지로 분류 가능 집합을 가장 잘 표현한 분류를 정하기 어려울땐 고유속성이 존재하는 분류를 서브타입은로 정하기 - 두번째 코드를 서브타입으로 표현했기 때문 코드 속성에 존재할 수 있는 코드명을 서브타입으로 표현하면 모델의 가독성이 높아져서 코드를 간혹 서브타입처럼 표현함 코드는 서브타입이 아니기 때문에 코드를 서브타입으로 표현하는 것은 바람직 하지 않음. 주문엔터티에 주문유형,매수매도, 국내국외 3가지 서브타입이 존재하는 것처럼 보임 그러나 서브타입은 하나만 정해야함 바커표기법에..

서브타입과 부분집합

서브타입 이해하기 위해서는 부분집합을 이해해야 함. 전체집합인 슈퍼타입을 부분집합으로 나눈 것이 서브타입이기 때문이다. 엔터티는 집합이다. 서로 명확하게 구별되는 데이터의 집합이 엔터티다. 집합은 원소로 이뤄져 있고, 이원소는 업무 식별자로 대표되는 하나의 인스턴스를 의미한다. 이런집합개념은 모델링의 근간이 되는 중요한 개념이다. 전체집합에서 개인고객에 해당하는 인스턴스만을 묶은 것이 개인고객 부분집합 서브타입은 이렇게 인스턴스를 기준으로 묶은 부분집합을 의미 개인 ·법인 고객 서브타입은 고객의 종류이면서 고객이라는 집합을 구성하는 부분집합 서브타입은 슈퍼타입 엔터티와 일대일 관계에 있는 엔터티를 의미 부분집합은 엔터티의 전체집합 중에서 일부 집합을 의미 부분집합은 개념적인 범주를 나타내는 용어지만, 서..

서브타입과 슈퍼타입

엔터티를 일반화 하거나 상세화 결과물 : 슈퍼타입과 서브타입이 생김 서브타입을 보면 차이점을 알기 쉽다. 유사한 엔터티에서 공통속성은 슈퍼타입 엔터티에 속하고, 고유속성은 서브타입 엔터티에 속함 슈포타입 속성은 모든 서브타입으로 상속되는 공통속성 일반화를 수행하는 과정에서 서브타입의 공통속성을 슈퍼타입속성으로 도출했으므로 당연히 만족하는 특성이며, 슈퍼타입과 서브타입 사이에는 상속개념이 존재해 슈퍼타입속성은 서브타입에 상속 슈퍼타입과 서브타입 관계는 체계를 의미하는 상하관계가 아니라 포함관계이다 사과는 과일에 포함되어 있다. 즉 서브타입은 슈퍼타입의 일부분이다. 모든 서브타입 집합은 반드시 슈퍼타입 집합이기 때문에 서브타입 인스턴스는 반드시 그에 해당하는 슈퍼타입 인스턴스가 존재하야 한다. 슈퍼타입과 서..

주식별자가 다른 엔터티 통합

-주식별자가 다른 엔터티 통합 주식별자가 다르더라도 데이터 성격이 같고, 기초속성이 유사하다면 통합할 수 있다. 예외) 업무식별자를 주식별자로 사용하지 않고, 인조식별자를 주식별자로 사용한 경우는 주식별자가 같더라도 다른 성격의 데이터 일 수 있으므로 무조건 통합 제외 -주식별자 속성의 개수가 같을때 알림서비스를 관리하는 엔터티로, 고객별로 관리하는지 계좌별로 관리하는지에 따라 주식별자가 달라진 엔터티. 단 주식별자를 구성한 속성의 개수는 같음. 통합하는 방법은 두가지이다. 첫번째 주식별자를 통합하는 것 고객계좌통합번호 속성은 고객번호/계좌번호 중 하나 사용.고객계좌구분코드 속성으로 구분가능 주식별자에 구분코드까지 포함시킬때 있지만, 없더라도 식별에 문제 없음 고객계좌통합번호는 조회할떄 주로 사용하기에 ..

데이터 통합과 합체

-데이터 통합 데이터 통합은 정규화를 기반으로 이루어짐. 데이터 통합은 동질성을 가진 데이터를 합치는 것 동질성을 파악하려면 데이터 성격을 규정할 수 있어야 함 속성과 엔터티의 명확한 이해가 선행되어야 데이터 성격을 알수 있음 데이터 통합은 엔터티 정의에 종속된 개념. 데이터 정의을 어떻게 하느냐에 따라 통합의 기준이 달라질수 있음 엔터티 정의는 정규화에 의해서 명확해짐. 데이터 정규화를 하고 나서 통합해야함. 통합된 모델은 통합하기 전에 정규화를 수행했기 때문에 확장성이 좋아진 것 업무 요건에 따른 엔터티 정의가 명확해야 수정이나 추가 또한 명확하게 할수 있음 잘알지 못하는 데이터에 다른 데이터를 추가할 수 없음 데이터 이해-> 정규화 -> 통합 -> 다른데이터 추가 가능 정규화가 기반이 되지 않은 통..

데이터 주제 영역

주제영역은 데이터 모델링 영역에서 이상과 현실 간의 괴리가 심한 영역 중 하나다. 주제영역을 잘 활용하려면 : 데이터 성격에 맞는 주제영역 도출/ 기업의 조직 구조가 주제 영역과 유사해야 함 - 주제영역 데이터 아키텍처의 최상위 단계로 비지니스의 목표를 달성하는 데 필요한 데이터 그룹을 의미 여기저기 산재되어 있는 유사한 성격의 데이터를 체계화 해 그룹을 묶은것 데이터를 유사한 성격으로 묶어 놓은 것 - 주제영역 구축하는 목적 기업의 정보 체계 구조를 한눈에 파악하고 관리할 수 있도록 하기 위함 데이터를 체계적으로 분류하는 것 자체로 중요 통합 모델을 만들기 위해서는 데이터 주제영역을 기준으로 모델링 해야 함 -같은 데이터가 모여 있다는것은 다른 데이터를 분리할 수 있다는 것을 의미 이는 데이터를 유연하..

데이터 통합(일반화/상세화)

1. 일반화/상세화 모델링에서 일반화한다는 것 데이터통합을 의미(일반화: 유사한것을 묶는것) 일반화하면 자연히 묶이게 되고 통합하게됨 상세한 (개별적인)것에서 출발해 일반적인 것으로 만드는방법 상향식방법(자연인,법인-->고객으로 일반화) 상세화,특수화,차별화 한다는것 하향식 방법으로 차이를 도출하는것(고객 --> 자연인 고객, 법인고객) 구체적을 따져 다른점강조 두리뭉실한 개념에서 구체적인 개념으로 만드는것 엔터티를 일반화 하거나 상세화 하면 슈퍼타입와 서버타입이 생김 데이터 통합과 일반화, 서브타입은 연관된 개념 일반화와 상세화 모두 결국은 차이를 보이기 위한 것 2.통합 시 주의할 점 - 성능 데이터 통합하면 데이터는 증가할수 밖에 없음. 데이터 증가와 성능은 상관관계가 있기에 주의를 살펴야 함. i..

정규화 요약

정규화는 속성에 종속성을 파악해서 엔터티를 설계하는것. 속성이 엔터티에 속하는 게 맞는지 판단하는 것. 엔터티를 대표하는 속성(업무식별자)을 찾은 후에 그 속성 기준으로 대상속성이 종속됐는지 여부를 판단 속성의 주인을 찾는 과정/중복을 최대한 제거하는 과정 정규화를 건친 모델을 정규형모델이라고 함 구분 제거대상 특징 1정규화 다가 ·복합속성 제거 반복속성제거 중첩릴레이션제거 속성이 추가되거나 일대다(1: M)관계의 엔티티가 추가되며 관계를 상속시킴 2정규화 부분종속제거 일대다(1:M)관계의 엔티티가 추가되며 관계를 상속받음 3정규화 이행종속제거 일대다(1:M)관계의 엔티티가 추가되며 관계를 상속받음 BC정규화 종속자가 키에 포함된함수종속제거 모든결정자는 키어야한다는 관점에서 3정규형과 같음 4정규화 다가..

5정규형

지나치게 이론적이고 이상적인 정규형이지만 실제로 사용하기에는 적합하지 않지만 다른 정규형과 구분하기 함수종속 기반 : 2,3,BC 정규형 다가종속 기반 : 4정규형 조인종속 기반 : 5정규형 - 어떤 릴레이션을 분해 한 다음에 조인해서 다시 원래의 릴레이션으로 복원할 수 있다면, 그 릴레이션은 조인 종속이 존재하는 릴레이션. 조인종속이 존재하는 릴레이션 5정규화 대상 -5정규형은 조인종속이 존재하지 않을때까지 분해한 릴레이션이다. 더이상 쪼갤수 없도록 릴레이션을 쪼갠 릴레이션이 5정규형이다. 다만 필요한 데이터가 사라지지 않는 무손실 분해가 되도록 분해하고, 필요없는 데이터가 생기지 않는 비부가적 분해가 되도록 분해한 릴리이션이다. ◀기술과 언어의 연관성이 존재하는 릴레이션/조인종속이 존재하는 릴레이션 ..

4정규형

함수종속개념 기반 정규형 : 2,3, BC 정규형 다가종속개념 기반 정규형 : 4정규형 다가종속이란? 한 릴레이션에 다가속성이 두개 이상 존재할때 발생. 하나의 다가속성값이 다른 다가속성의 모든 값마다 중복되는 것을 다가 종속 두개의 다가 속성값 사이에 M:M관계가 발생하면 다가 종속 됐다고 함. 두개의 독립적이 일대다(1: M) 관계의 속성이 하나의 릴레이션에 존재하면 다가종속이 발생함 ◀ 다가속성이 존재하는 릴레이션 사원은 여러기술을 갖고 있고, 사용언어도 여러개다. 언어와 기술은 아무런 연관관계가 없다. 즉 이릴레이션만으로는 홍길동이 모델링을 영어로 할수 있는지 알수 없다. ◀다가속성이 발생한 릴레이션 위 속성을 하나의 릴레이션으로 관리하게 되면 많은 중복 데이터가 존재 사원은 2명이지만 이름은 열..

728x90
반응형
LIST