카테고리 없음

데이터 표준화

mitomi 2024. 4. 10. 21:55
반응형
SMALL

1. 데이터 표준화 필요성

 

가 .데이터 활용성의 문제점

 · 데이터의 중복 및 조직, 업무, 시스템 별 데이터 불일치 발생  : 데이터 표준 정책의 미비로 정보시스템 개발 및  운영 과정상에서 동일한 의미의 데이터를 다른 명칭으로 중복 관리하거나 동일한 명칭의 데이터를 시스템간에 상이한 로직으로 산출하여 다른의미로 활용

 · 데이터에 대한 의미 파악 지연으로 정보제공 적시성 결여 : 데이터 명칭, 데이터 정의에 대한 표준 미관리로 인해 새로운 정보요건이나 정보 요건 변경 시 필요 데이터를 파악하는데 많은 시간을 낭비하여 정보 사용자에게 정확한 정보를 제공하는데 어려움이 있다.

 · 데이터 통합의 어려움 : 단위 시스템 위주의 데이터 표준을 적용하거나 적용치 않는 경우도 존재하여 전사 데이터 웨어하우스 구축등 전사 데이터에 대한 통합적인 정보 요건을 기반으로 시스템을 구축할 때에는 데이터의 의미 파악 및 데이터의 중복여부 파악등에 많은 어려움이 있다.

 

나. 데이터 문제점 원인

 · 동시 다발적인 정보시스템 개발 : 단위시스템 개발보다는  정보시스템을 동시에 개발하는 경향이 뚜렷하다. 이런 개발환경에서 데이터 표준 정책없이 단위 시스템 위주로 표준정책을 수립하여 단위시스템의 업부 기능 구현에 맞추어 개발 프로젝트가 진행되었다.

 · 전사 데이터 관리 마인드 미형성 :  데이터 관리 주체가 단위시스템 개발자, 운영자 중심으로 이루어져 있어 단위 업무 지원에 초점을 맞추고 있다. 최근에는 여러시스템의 데이터를 복합적으로 활용하는 경우가 많으므로 전사 데이터를 체계적으로 관리하고자 하는 마인드 형성이 필요하다.

 · 전사 데이터 관리 인력 부재 :  정보시스템 개발단계에서는 개발 수행사의 품질관리 조직을 통해 표준에 대한 관리가 이뤄진다. 유지보수 단계에서는 개발 단계에서 수립됮 표준과  표준준수 관리에 대한 역활을 맡은 전문적인 데이터 관리 인력을 활용치 않고 개별 유지 보수 인력들에 의존한다.

 · 전사 데이터 표준 관리 도구 부재 : 데이터 표준관리에는 데이터 표준, 데이터 표준 준수 체크, 데이터 표준 조회 및 활용등 많은 자동화한 시스템의 지원을 필요로한다. 정보시스템 개발 시에는 수잡으로 데이터 표준의 적용,  준수 체크등을 수행하였지만 운영단계에서 수작업에 가까운 표준 관리 방법은 많은 애로 사항이 존재한다.

 

다. 데이터 관리 개선 방안

데이터가 기업의 전략적 의사결정을 위한 핵심 요소이기 때문에 데이터 통합 데이터 품질을 달성하기 위해서는 전사적인 데이터 표준화 활동이 필요하다.

 · 데이터 표준화, 규격화를 위한 기본방침 설정

 · 전사적인 정보 공유를 위해 유지되어야 할 공통 데이터 요소의 도출

 · 전사적인 데이터 요소 등록 및 관리 체계 구축

 · 정보시스템 개발 및 유지보수 시 승인된 데이터 요소를 활용함으로써 시스템 개발의 효율성 및 데이터 공유성 향상

 

2. 데이터 표준화 기대 효과

현업은 정확한 데이터 사용할 수 있고, 올바른 의사결정을 내릴수 있음.

 · 명칭의 통일로 의사소통 증대

   동일한 데이터에 대해서는  동일한 명칭을 사용함으로써 개발자-현업사용자, 운영자-현업사용자 다양한 사용자 간에 일관성 있고 신속한 의사소통이 가능

 · 필요한 데이터의 소재 파악에 소요되는 시간 및 노력 감소

   새로운 정보 요건 사항 발생 시 표준화한 데이터를 사용함으로 써 데이터의 의미, 데이터의 위치등을 신속하게 파악할 수 있어 정보 활용자에게 원하는 시기에 정확한 정보 전달

 · 일관된 데이터 형식 및 규칙의 적용으로 인한 데이터 품질 향상

   데이터 형식 규칙을  데이터표준에 맞게 적용함으로써 데이터 입력 오류방지를 통해 데이터품질 향상시킬수 있음. 데이터 활용에 있어 표준에 근거하여 활용함으로써 잘못된 데이터의 활용으로 인한 의사결정의 오류를 줄일 수 있음.

 · 정보시스템 간 데이터 인터페이스 시 데이터 변화, 정제 비용 감소

전사적으로 데이터 표준에 의해 데이터가 관리되고 있으면 별도의 변환이나 정제작업을 수행하지 않고 그대로 활용하면 되기 때문에 별도의 비용이 발생하지 않는다.

 

2. 데이터 표준화 정의

데이터 표준화는 시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 전사적으로 적용하는 것을 말한다.

 

가. 데이터 명칭

데이터 명칭은 기업내에서 데이터를 유일하게 구별해 주는 이름이다. 데이터 명칭에 대한 표준는 동음이의어 및 이음동의어의 조정을 필요로 한다. 

 · 유일성 : 데이터 명칭은 해당 개념을 유일하게 구분해 주는 이름이어야 한다. 하나의 개념에 대해 모든 사용자가 통일된 용어를 사용할 수 있도록 오직 하나의 명칭만을 허용해야 한다.

  ex1)   고객 계좌번호, 고객 구좌번호 → '고객 계좌번호' 로 통일

  ex2)   EMAIL  주소, EMAIL  → ' EMAIL 주소'로 통일

 

 · 업무적 관점의 보편성  : 데이터 명칭은 업무적 관점에서 보편적으로 인지되는 이름이어야 한다. 조직내 구성원들이 해당 개념을 지칭할 때 가장 많이 사용하는 업무 용어를 그대로 사용하는 것이 바람직하다.

 

 · 의미 전달의 충분성  : 데이터 명칭은 이름만으로 데이터의 의미 및 범위가 파악 될 수 있어야 한다. 업무나 사용자의 관점에 따라 의미가 달라질 수 있는 이름은 수식어 등을 사용함으로 써 구체화하는 것이 좋다.

 

나. 데이터 정의

데이터 정의는 해당 데이터가 의미하는 범위 자격 요건을 규정한다. 사용자가 데이터의 의미를 가장 잘 이해 할 수 있도록 업무 관점에서 범위와 자격요건을 명시해야 하고, 데이터 명칭만으로 사용자에게 전달하기 어려원 기타사항들을 전달하는 역활을 한다. 데이터의 정의는 데이터 소유자를 결정하는 기준이 된다.

 · 데이터 사용자가 데이터의 의미를 잘 이해할 수 있도록 관련 업무를 모르는 제3자 입장에서 기술한다.

 · 서술식 정의만으로 데이터의 의미 전달이 어려울 경우 실제 발생할 수 있는 값도 같이 기술한다.

 · 데이터 명칭을 그대로 서술하거나 약어 또는 전문용어를 이용한 정의  기술은 가급적 사용하지 않는다.

 

다. 데이터 형식

 데이터 형식은 데이터 표현 형태의 정의를 통해 데이터 입력 오류와 통제 위험을 최소화하는 역활을 한다. 데이터형식은 업무 규칙 및 사용 목적과 일관되도록 정의한다.

· 데이터 타입(Numeric, char,Date,Timestamp 등)

· 데이터 길이 및 소수점 자리

·  도메인을 정의하여 데이터 표준에 적용함으로써 성격이 유사한 데이터 간의 데이터 형식을 통일한다.

·  데이터 최대값 또는 최대 길이가 고정되어 있지 않을 경우 충분히 여유있게 정의한다.

· 특수 데이터 타입(CLOB, Long Raw)데이터 조회, 백업, 이행 등에 있어서 제약사항이 존재하는 경우가 많기 때문에 가급적 사용하지 않는다.

 

라. 데이터 규칙

데이터 규칙은 발생 가능한 데이터 값을 사전에 정의함으로써 데이터의 입력 오류와 통제 위험을 최소화하는역활을 한다. 데이터 규칙을 통해 데이터의 정합성 및 완전성을 향상시킬수 있다. 

· 기본값 데이터 타입에 따라 사용자 화면에 입력값이 없어도 미리 정의된 기본값이 입력될 수 있도록한다.

· 허용값 업무규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 제한하는 것. 데이터 항목별로 가질수 있는 값을 사전에 정의하는 경우가 이에 해당

· 허용범위 업무규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 범위로 제한하는 경우 

 

 

 

 

 

 

 

728x90