˘1. 데이터 표준화 필요성
- 데이터 표준화 필요배경
- 데이터 표준화 저해 요소
- 데이터 표준화 개선을 위한 방안 이해
- 데이터 표준화 수행하리 위해 필요한 구성요소 및 개념 이해
- 데이터 표준을 지속적으로 준수하고 유지하기 위한 관리도구 이해
데이터 표준화의 필요성
데이터의 품질확보 및 원활한 데이터 활용을 위해 데이터표준화 필수적으로 수반되어야 함.
-데이터 활용상 문제점
· 데이터의 중복 및 조직 업무 시스템별 데이터 불일치 발생(데이터표준 정책 미비로 동일한 의미 데이터 다른명칭사용되거나 동일명칭 데이터를 다른의미로 활용하는 문제)
· 데이터에 대한 의미 파악 지연으로 정보 제공의 적시성 결여(데이터 명칭,정의에 대한 표준미관리로인해 발생)
· 데이터 통합의 어렴움(단위시스템 위주의 데이터표준을 적용하거나 적용치 않는 경우도 존재하여 DW구축시 데이터 의미파악 중복여부 파악 어렴움)
· 정보시스템 변경 및 유지보수 곤란
(데이터 의미파악에 어려움을 격고, 새로운 정보 요건 반영 시 기존 데이터 활용이 가능한지 파악이 어려워 유지보수 많은 노력이 따름)
-데이터 문제점의 원인
· 동시 다발적인 정보시스템 개발(전사 표준없이 단위시스템별 표준정책 수립하여 프로젝트 진행)
· 전사 데이터 관리 마인드 미형성(데이터 관리 주체가 단위업무위주가 아닌 전사 데티어를 체계적으로 관리하고자 하는 마인드 필요)
· 전사 데이터 관리 인력 부재(데이터 관리 인력을 사용하지 않고 개별 유지 보수 인력들에 의해 의존)
· 전사 데이터 표군 관리 도구 부재(데이터 표준, 표준준수체크, 데이터 표준 조회 및 활동등 자동화 도구 필요)
- 데이터 관리 개선 방안
데이터가 기업의 전략적 의사결정을 위한 핵심 요소이기 때문에 데이터 통합 , 데이터 품질을 달성하기 위해서 전사적인 데이터 표준화활동 필요
· 데이터 표준화, 규격화를 위한 기본방침 설정
· 전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출
· 전사적인 데이터 요소 등록 및 관리체계 구축
· 정보시스템 개발 및 유지 보수 시 승인된 데이터 요소를 활용함으로써 시스템 개발의 효용성 및 데이터 공유성 향상
- 데이터 표준화 기대효과
현업사용자는 정확한 데이터를 사용할 수 있고, 올바른 의사결정을 내릴 수 있으며, 기업의 경쟁력 확보에 많은 영향을 미친다.
· 명칭의 통일로 인한 명확한 의소소통의 증대
· 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소
· 일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상
· 정보시스템 간 데이터 인터페이스 시 데이터 변화, 정제 비용 감소
2. 데이터 표준화 개념
데이터 표준화 정의
시스템별로 적재되어 있는 데이터 정보 요소에 대한 명칭, 정의 ,형식, 규칙에 대한 원칙을 수립하여 전사적으로 적용하는 것을 의미한다. 표준화 작업은 데이터의 정확한 의미를 파악할 수 있게 할 뿐만 아니라 데이터에 대한 상반된 시각을 조정하는 역활을 수행한다.
데이터 명칭 한글명
데이터 정의 → 전사적 표준 적용 → 영문명/영문약어
데이터 형식 데이터 타입/ 데이터 길이/ 소수점 이하 길이
데이터 규칙
- 데이터 명칭
기업에서 데이터를 유일하게 구별해 주는 이름이며, 데이터 명칭에 대한 표준화는 동음이의어 및 이음동의어의 조정을 필요
· 유일성 : 데이터 명칭은 유일하게 구분해 주는 이름이어야함
고객계좌/ 고객구좌번호 → 고객 계좌번호
· 업무적 관점의 보편성 : 데이터 명칭은 업무적 관점에서 보편적으로 인지되는 이름이어야 함. 조직내의 구성원들이 해당 개념을 지칭할때 가장 많이 사용하는 업무 용어를 그대로 사용하는 것이 바람직
· 의미 전달의 충분성 : 데이터 명칭은 이름만으로 데이터의 의미 및 범위를 파악될수 있어야 함. 업무 사용자 관점에 따라 의미가 달라질 수 있는 이름은 수식어 등을 사용함으로 써 구체화 하는 것이 좋다.
- 데이터 정의
데이터 정의는 해당 데이터가 의미하는 범위 및 자격 요건을 규정한다. 사용자가 데이터의 의미를 이해할 수 있도록 업무관점에서 범위와 자격 요건을 명시해야 하고, 데이터 명칭만으로 전달하기 어려움 사항등을 전달하는 역활을 한다. 데이터 정의는 데이터 소유자를 결정하는 기준이 된다.
※ 데이터 정의를 기술할 경우 고려할 사항
ˇ 데이터 사용자가 데이터 의미를 잘 이해할 수 있도록 관련업무를 모르는 제3자의 입장에서 기술한다.
ˇ 서술식 정의만으로 데이터의 의미 전달에 어려울 경우 실제 발생할 수 있는 데이터의 값도 같이 기술한다.
ˇ 데이터 명칭을 그대로 서술하거나 약어 또는 전문 용어를 이용한 정의 기술으 가급적 사용하지 않는다.
-데이터 형식
데이터 형식은 데이터 표현 형태의 정의를 통해 데이터 입력오류와 통제위험을 최소화하는 역활을 한다.
데이터 형식은 업무규칙 및 사용 목적과 일관되도록 정의한다.
ˇ 데이터 타입/데이터길이 및 소수점 자리
※ 데이터 형식 정의할때 고려사항
ˇ 도메인을 정의하여 데이터 표준 적용함으로써 성격이 유사한 데이터 간의 데이터 형식을 통일한다.
ˇ 데이터의 최대값 또는 최대 길이가 고정되어 있지 않을 경우 충분히 여유있게 정의한다.
ˇ 특수 데이터 타임(LOB, Long Raw)등은 데이터 조회 백업,이행등에 있어서 제약사항이 존재하는 경우가 많아 고려하여 사용한다.
- 데이터 규칙
데이터 규칙은 발생 가능한 데이터 값을 사전에 정의함으로 써 데이터 입력오류와 통제위험을 최소화하는 역활을한다. 데이터 규칙을 통해 데이터의 정합성 및 완저성을 향상할 수 있다.
※ 데이터 규칙의 유형
ˇ 기본값 : 데이터 값의 입력을 생략했을 경우 자동으로 입력되는 데이터값을 의미한다.
Numeric 타입-기본값 '0' Char type항목 '스페이스' 자동으로 입력
ˇ 허용값 : 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 제한하는 것
표준코드 중 데이터 항목별로 가질수 있는 코드값을 사전에 정의하는 경우
ˇ 허용범위 : 업무규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 범위로 제한하는 경우이다.
허용범위를 1-5까지 정의한 경우 1-5이외에 입력이 불가능하도록 사전에 제한할 수 있다.
데이터 표준화 구성요소
데이터 표준화를 추진하기 위해 수립해야 할 표준화 구성요소는 데이터 표준, 데이터 표준관리 조직, 데이터 표준화 절차
데이터 표준
데이터 표준 관리 조직 → 전사 데이터 표준화
데이터 표준화 절차
- 데이터 표준
데이터 표준화는 기본적으로 데이터 모델 및 데이터베이스에서 정의 할 수 있는 모든 객체를 대상으로 수행하는 것이 이상적이지만, 주로 관리해야 될 필요성이 있는 객체만을 대상으로 데이터 표준화하는 것이 효율적이다.
데이터 표준으로 관리되는 대상에는 용어, 단어 ,도메인, 코드
· 표준 용어 : 업무적으로 사용하는 용어에 대한 표준을 정의함으로써 용어 사용 및 적용에 대한 혼란을 방지하고 원활한 커뮤니케이션을 촉진한다.
ˇ 업무적 용어 : 일상 업무에서 사용하는 용어로 보고서나 업무 매뉴얼 상에서 많이 나타난다. 데이터 표준화 작업은 주로 데이터베이스에 적용하고 사용할 객체에 구한되기 때문에 업무적 용어의 표준화가 반드시 필요한건 아니다. 그러나 데이터베이스에서 적용할 용어들이 대부분 현업에서 사용하는 용어를 그대로 수용한다는 점을 고려하면, 업무적 용어의 표준화는 데이터 표준화 작업을 수월하게 해주는 장점이 있다. 업무적 용어 표준화의 예는 색인을 들수 있다.
ˇ 기술적 용어 : 정보시스템에서 사용하는 용어를 지칭한다. 데이터 모델 또는 데이터베이스 스키마에서 나타나는 테이블명 컬럼명등이 기술적 용어에 해당한다.
데이터 표준화 측면에서 용어를 표준화한다는 것은
업무적인 용어를 정보시스템에 반영하기 위해 기술적인 용어로 전환하고
이것을 일관되게 유지하고 관리한다는 것이다.
테이블 컬럼의 한글명은 대부분 업무적으로 용어를 그대로 수용하는 것이 이상적이지만, 데이터베이스의 제약 사항과 표준단어의 사용에 따라 업무적 용어와는 상아하게 정의 될수 있다.
· 표준 단어 : 표준용어를 구성하는 단어에 대한 표준을 정의함으로 써 용어에 대한 한글명과 영문명을 일관되게 정의
표준 단어의 목적
ˇ 표준단어를 관리함으로써 동일한 개념을 의미하는 용어의 생성을 예방한다. 고객과 계좌 표준단어 정의함으로써 고객계좌 용어만 인정되고 고객 구좌용어는 표준에서 배제
ˇ 표준 용어는 영문명 작성이 기준이 된다. 테이블 및 컬렄의 한글명만 작성하면 영문명은 표준단어에 의해 자동으로 결정된다.
· 표준 도메인 : 표준 도메인은 칼럼에 대한 성질을 그루핑한 개념이다. 크게 문자 숫자 일자 시간형으로 구분하고 세부적으로 명, 주소, 금액,율,등으로 분료한다.
도메인 표준을 정의함으로써 동일한 성질을 가진 컬럼의 데이터 타입 및 데이터 길이를 일관되게 관리할수 있으며, 향후 칼럼의 값에 대해 공통적이 데이터 검증 규칙의 적용이 가능하다.
· 표준 코드 : 코드는 도메인의 한 유형으로서 특정 도메인 값이 이미 정의 되어 있는 도메인이다. 코드에 대한 표준은 다른 표준과 달리 데이터 값 즉 코드 값까지 미리 정의해야 한다.
· 기타 데이터 표준 관련 요소 : 데이터 모델에서 정의하는 주제영역, 관계명과 데이터베이스 정의하는 데이터베이스 스키마 테이블, 테이블스페이스, 인덱스등에 대한 표준을 관리한다.
- 데이터 표준 관리 조직
전사적으로 수립된 표준 원칙, 데이터 표준 , 데이터 표준준수 여부 관리등 위해서 데이터관리자의 역활이 요구된다.
데이터관리자는 하나의 기업 또는 조직 내에서 데이터에 대한 정의,체계화, 감독 및 보안 업무를 담당하는 관리자를 의미한다.
· 데이터 관리자 주요 역활
ˇ 데이터에 대한 정책과 표준정의, 표준에 대한 변경과 추가 발생 시 최종 승인 의사결정을 수행해야 함.
시스템에 있는 데이터의 표준준수 여부를 주기적으로 체크하여 지속적인 표준관리 활동을 수행한다.
ˇ 부서 간 데이터 구조 조율. 전사 데이터 관리 기준에 의거하여 단위시스템이나 조직 부처에 명확한 데이터 관리 기준 제시하고, 부서간 데이터 구조에 대한 이견 발생 시 전사 데이터 관리 관점에서 데이터 구조를 제시하여 체계적인 데이터 구조가 이루어지는 역활을 수행
ˇ 데이터 보안 관리 데이터 보안 정책 수립, 보안 정책 준수 여부 체크, 보안시정 조치요구등을 수행한다.
ˇ 데이터 모델 관리 데이터 모델을 몰리적인 변경 시점에 동일하게 관리함으로써 신속한 의사결정이 이뤄지도록 관리
ˇ 데이터의 효율적인 활용 방안 계획 데이터 활용상의 문제점등을 체크하여 데이터 활용과 관련된 방안을 수립하여 시행
· 데이터 관리자 세부 역활
전사 데이터 관리자 - 업무데이터 관리자 - 업무시스템 데이터관리자
ˇ 전사 데이터 관리자 : 데이터 표준화에 대한 정책 결정. 검토한 데이터 표준 제안에 대한 승인
ˇ 업무 데이터 관리자 : 담당 업무 기능의 데이터 요구사항 반영을 위해 필요한 데이터 표준 정의.
업무관련 데이터 표준 변경 제안에 대한 합동 검토
ˇ 업무 시스템 데이터 관리자 : 시스템 관리 목적의 데이터 요구 사항을 위해 필요한 데이터 표준 정의.
업무과련 데이터 표준변경 제안에 대한 합동 검토.
데이터 모델에 대한 데이터 표준 적용 및 준수 여부 체크
· 데이터베이트 관리자와 비교
구분 | 데이터 관리자 | 데이터베이스 관리자 |
관리대상 | 데이터 요구 사항을 반영한 데이터 모델 및 각종표준 | 데이터 모델을 특정 데이터베이스 제품의 특성에 맞춰 구축한 데이터베이스 |
주업무 | 업무에 필요한 데이터의 메타 데이터를 정의하고 신규 또는 변경된 요구사항을 신속하게 데이터모델에 반영 | 요구되는 성능 수준을 발휘하면서 안정적으로 운영되도록 데이터베이스관리 |
품질수준 확보 | 데이터 표준의 관리 및 적용을 통해 품질수준확보 | 데이터의 정합성 관리를 통해 데이터품질 수준확보 |
전문기술 | 담당 업무 분야에 대한 업무 지식과 데이터 모델링에 대한 전문성 필요 | 데이터 모델에 대한 해독능력 및 특정 데이터베이스 제품에 대한 전문지식 필요 |
데이터 표준화 절차
구분 | 주요 활동 |
데이터 표준화 요구사항 수집 | ˇ 개별 시스템 데이터 표준 수집 ˇ 데이터 표준화 요구사항 수집 ˇ 표준화 현황 진단 |
데이터 표준 정의 | ˇ 표준화 원치 ˇ 데이터 표준 정의 : 표준용어, 표준 단어, 표준 도메인, 표준 코드, 기타 표준 |
데이터 표준 확정 | ˇ 데이터 표준 검토 및 확정 ˇ 데이터 표준 공표 |
데이터 표준 관리 | ˇ 데이터 표준 이행 ˇ 데이터 표준 관리 절차 수립 : 데이터 표준 적용, 변경, 준수 검사 절차 |
'DA' 카테고리의 다른 글
데이터 표준 관리 도구 (0) | 2024.04.21 |
---|---|
정보 요구 사항 이란? (2) | 2024.04.07 |
3.데이터거버넌스 (0) | 2024.03.20 |
2.데이터아키텍처 구축 (0) | 2024.03.15 |
1. 데이터아키텍처 이해 (0) | 2024.03.11 |