데이터 거버넌스는 데이터 표준 및 정책에 따라 비즈니스 데이터를 생성·변경하고 생성된 데이터의 가용성·유용성·무결성과 보안을 관리하는 프로세스입니다. 많은 조직에서 업무 데이터를 분석한 결과로 비즈니스 의사 결정을 하고 있어 그 중요성이 높아지고 있습니다.
과거의 데이터 거버넌스는 비교적 간단했습니다. 비즈니스 데이터는 업무 시스템에서 생성되어 방화벽 뒤에 보관되었으며 IT 또는 BI(Business Intelligence) 전문가들이 특정 업무에서 산출되는 고정적인 데이터를 분석하여 보고하였습니다.
2010년대 들어 기업들이 데이터의 가치를 깨닫고 본격 활용에 나서면서 부서마다 데이터 분석 결과가 다르게 산출되는 문제가 발생하였고 분석 결과를 놓고 많은 논쟁이 있었습니다. 분석에 사용한 데이터가 적절한지, 데이터 품질은 믿을 수 있는지 등을 논의하는 과정에서 '전사적으로 동일한 기준에 의한 데이터 관리'의 필요성이 대두되었습니다.
그래서 전사 데이터 기준을 하나로 정의하고 그 기반에서 데이터 활동을 전개하는 기준정보 관리체계(Master Data Management, MDM)가 도입되었습니다. 이를 토대로 데이터를 잘 활용하는 것이 수익 증대 및 원가 절감과 직결된다는 것을 경험하면서 전사 관점에서 데이터 과제를 발굴하고 추진하게 된 것입니다. 기준정보 관리체계가 등장하면서 데이터 거버넌스는 진일보했으며, IT 부서가 아니라 혁신 담당 부서와 현업 부서에서 데이터 표준 수립 및 데이터 오너십을 포함한 R&R(Role and Responsibilities) 정립을 담당하게 되었습니다.
최근에는 저비용 스토리지 및 컴퓨팅 리소스가 등장하고 더욱 다양한 유형의 데이터에 접근이 가능해지면서 많은 조직의 데이터 사이언티스트들과 현업들은 데이터를 빠르게 분석할 수 있는 방법이 필요하게 되었습니다. 이러한 요구로 인해 데이터 분석이 중앙집중식에서 분산·셀프 서비스화 되어가고 있습니다.
디지털 경제는 곧 데이터 경제입니다. 디지털화는 빅데이터 시대를 열었으며 조직의 데이터는 폭발적으로 증가하고 데이터의 원천도 내부에서 외부로 확대되었습니다. 과거에는 내부에서 발생한 데이터가 전부였지만 이제는 오픈 데이터, 소셜 데이터 등을 이용할 수 있게 되었습니다. 디지털 경제는 인터넷 또는 모바일에서 거래가 대부분 이루어지고 있으며, IoT(Internet of Things)를 이용한 사물 간 연결, 챗봇과 음성봇을 활용한 고객 서비스 등이 확대되고 있습니다. 디지털 경제 이전에는 거래가 확정된 경우에만 고객 데이터를 수집하였으나 지금은 고객 접점에서 발생하는 모든 데이터로 범위가 확대되었습니다.
또한 개인 데이터 보호 규제는 강화되고 있습니다. 기업은 개인 데이터를 안전하게 보관하는 것뿐만 아니라 데이터 사용 동의, 데이터 삭제 요청, 프로파일링 중지 요청 및 데이터 전송 요청 등의 개인 데이터 권리 보장을 위한 규제를 준수해야 합니다. 개인 데이터 보호 외에도 자금 세탁 방지, 건전성 규제 등 기업에 대한 규제들은 대부분 데이터와 관련성이 크기 때문에 데이터를 잘 관리하지 않으면 이러한 규제를 지킬 수 없고 결국 큰 손실을 초래하게 됩니다.
다양한 원천으로부터 고객 데이터를 수집해 통합·분석하여 업무에 내재화함과 동시에 데이터 컴플라이언스를 준수하면서 외부와 데이터를 주고받을 수 있으려면 데이터 거버넌스를 정립하는 것이 필수적입니다. 이 기반을 갖춘 다음에 디지털 비즈니스를 도입하거나 확장해야 합니다.
데이터 거버넌스의 주요 목표는 조직의 데이터 사일로를 분해하는 것입니다. 이러한 사일로는 일반적으로 중앙집중식 제어가 아닌 개별 업무 시스템을 통해서 데이터가 생성되고 배포·공유될 때 형성됩니다. 또 다른 목표는 시스템에 오류가 발생하는 것을 방지하고 고객 및 기타 민감한 정보 등 개인 데이터의 잠재적 오용을 차단하여 올바르게 활용되도록 하는 것입니다. 이것은 지속적인 사용량 모니터링과 데이터 활용 정책의 수립·시행을 통해 달성할 수 있습니다. 그 외에도 데이터 거버넌스 적용을 통해 데이터 품질을 높일 수 있으며 궁극적으로 경영진의 올바른 의사결정을 이끌어내 경쟁 우위를 점하고 수익·이익을 높일 수 있습니다.
데이터로 인해 얻을 수 있는 효과와 실제 얻고 있는 효과의 차이를 데이터 거버넌스 갭이라고 합니다. 거버넌스 갭은 세 가지 유형으로 발생합니다. (출처: Hitachi Vantara)
데이터 거버넌스 갭이 작은 조직(선진 조직)과 그렇지 않은 조직(일반 조직)의 중요한 차이점은 다음과 같습니다. (출처: Hitachi Vantara)
선진 조직과 일반 조직 간의 데이터 거버넌스 갭은 평균 두 배 이상이며 데이터 거버넌스 갭이 클수록 기업 성과 차이도 클 것이라는 예측이 가능합니다. 이러한 데이터 거버넌스 갭을 줄이기 위한 구체적인 방안은 데이터 거버넌스 프레임워크와 조직 R&R을 정립하는 것입니다.
데이터 거버넌스 프레임워크는 거버넌스 프로그램을 위한 정책, 규칙, 프로세스, 조직 구조 및 기술로 구성됩니다. 조직의 거버넌스 프레임워크를 문서화하고 관련된 모든 사람에게 공유해야 하며 기술적으로는 데이터 거버넌스 소프트웨어를 사용하여 거버넌스 프로그램 관리를 자동화할 수 있습니다. 데이터 거버넌스 도구는 프레임워크의 필수 요소는 아니지만, 프로그램과 워크플로우의 관리·협업·데이터 카탈로그 생성 등을 지원합니다. 또한, 데이터 품질관리, 메타 데이터 관리 및 기준정보 관리(MDM) 도구와 함께 사용할 수 있습니다.
데이터 거버넌스의 비즈니스 가치를 입증하려면 데이터 품질 개선 결과를 정량화할 수 있는 메트릭(Metric)의 개발이 필요합니다. 예를 들어 분기별로 해결된 데이터 오류 수와 그것으로 인한 수익 증가·비용 절감 등이 있습니다. 일반적인 데이터 품질 메트릭은 데이터 세트, 데이터 완전성 및 일관성과 같은 관련 속성의 정확도와 오류율을 측정하는 용도로 사용합니다. 거버넌스 프로그램은 셀프 분석하는 사용자가 데이터에 정확하게 액세스 할 수 있도록 해야 함은 물론 데이터를 오용하거나 개인정보 보호 및 보안을 침해하지 않도록 해야 합니다.
빅데이터 시스템의 발전은 새로운 데이터 거버넌스 요건을 제기하게 되었습니다. 데이터 거버넌스 프로그램은 전통적으로 관계형 데이터베이스에 저장된 정형 데이터에 중점을 두었지만, 이제는 빅데이터 환경에서의 정형·비정형·반정형 데이터는 물론 하둡(Hadoop)과 스파크(Spark) 등 다양한 데이터 플랫폼 환경을 지원해야 합니다. 빅데이터 세트는 데이터 레이크(Data Lake)에 원시 형식으로 저장되고 분석의 용도와 목적에 맞게 필터링하여 사용합니다.
데이터에 관한 정책을 발의하고 결정합니다. 조직 내 여러 부서에서 인력을 차출하여 구성함으로써 전체 조직원을 대표할 수 있어야 합니다.
탑다운(Top-down) 방식으로 새로운 정책 및 효과를 회사 이해 관계자들에게 설명하고 시행합니다.
데이터 거버넌스 위원회와 나머지 조직원들 간의 양방향 커뮤니케이션을 돕고 팀 수준에서 새로운 정책을 시행합니다. 특히 관리자는 데이터 거버넌스 정책이 본인의 팀과 어떤 관련이 있는지 알아야 하며 정책으로 인해 팀의 업무가 더 복잡해지는 경우에는 데이터 거버넌스 위원회와 의사소통해야 합니다.
새로운 정책을 적극적으로 따라야 하며 관리자와 마찬가지로 자신의 요구사항을 데이터 거버넌스 위원회에 전달할 수 있어야 합니다. 특히 업무수행 방식을 바꾸는 경우 조직원들의 요구사항은 데이터 보안 다음으로 데이터 거버넌스 위원회의 최우선 순위가 되어야 합니다.
여전히 많은 기업이 중요한 의사결정을 경영진의 직감에 의존하고 있습니다. 규모가 큰 회사일수록, 전통 산업에 가까울수록 이러한 경향은 더 강하게 나타납니다. 데이터가 경쟁우위를 점하기 위한 핵심 자산이 되는 시대, 데이터 기반 경영은 더 이상 낯선 말이 아닙니다. 현업 실무자부터 최고 경영진에 이르기까지 기업 전체가 신속, 정확한 의사결정 체계를 갖추기 위해서는 조직 내에 데이터를 책임지는 임원(CDO)과 부서를 신설하고 데이터 거버넌스 프레임워크와 담당 조직 간 R&R을 정립하여 운영하는 것이 필히 뒷받침되어야 할 것입니다.
▶ 해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 기고자에게 저작권이 있습니다.
▶ 해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.
에스코어㈜ 컨설팅사업부 데이터컨설팅팀
제조·의료·화학·자동차 산업 등 다양한 업종에서 데이터 기반의 업무혁신 컨설팅을 수행해 왔으며, 현재 삼성전자 DS 부문의 기준정보 및 업무혁신 컨설팅 프로젝트를 담당하고 있습니다.