데이터 컬처는 간단히 이야기하면 데이터 기반으로 의사 결정을 하는 기업 문화이다. 기업은 더 나은 의사 결정을 원하기 때문에 데이터 컬처를 구축하려고 한다. 데이터 컬처라는 조직 문화를 설명하기 전에, 일반적인 기업 조직이 의사 결정을 위해 가진 ‘합의’와 ‘계층’ 문화에 대해 알아보자.
합의 문화의 최종 목적은 ‘합의 달성’이다. 합의 문화는 모든 사람이 발언권이 있고, 누구의 발언이나 무시되지 않기에 일상적으로 좋은 문화라고 느껴질 수 있는 반면에 의사 결정 속도가 느리고, 혁신에 소극적인 단점이 있다. 모두 합의해야 하는 큰 부담감 때문에, 대규모 조직일수록 기존의 방향에 변화를 만드는 혁신적 아이디어에 익숙하지 않다. 이와 대척점에 서 있는 것이 계층 문화이다. 무엇보다 지위나 연공서열을 중요시하며, 모든 사람은 상위에 있는 사람의 의견을 따른다. 아이디어를 생성하고 선택하는 능력이 선택된 소수에게만 국한되므로 새로운 시장에 대한 도전 경험이 주어지지 않는 그 외의 구성원들의 사기는 저하된다. 이런 문화는 궁극적으로 창의성을 없애고 새로운 변화에서 오는 기회를 놓치기 쉽다. 또한 이런 ‘상위층’ 사람들의 결정은 시장의 변화가 빠르고 새로운 시장이 생겨나는 상황에서는 정답이 아닐 가능성이 크다.
데이터 컬처에서는 데이터의 증거가 무엇보다 중요하며 최고의 가치를 가진다. 누가 말하고 어떤 지위를 가졌는지는 중요하지 않다. 중요한 것은 결정이 데이터를 기반으로 하고 있는지 그 여부일 뿐이다. 합의 및 계층 문화는 사용하기 빠르고 쉽다. 회의실에서 동료에게 언제든지 의견을 구하거나 전화 한 통으로 상사에게 문의할 수 있다. 그러나 데이터 컬처가 되려면, 즉 데이터에서 답을 찾을 수 있으려면 데이터가 즉시 사용 가능하고 신뢰할 수 있으며 해석할 수 있어야 하는 여러 가지 복잡한 프로세스와 시스템이 필요하다. 데이터 컬처를 가진 조직은 느리게 움직이는 합의 문화와 무조건적인 계층 문화에 비해 올바른 사업 결정을 할 가능성이 높다.
포레스터 리서치에 따르면, 데이터를 기반으로 한 인사이트 중심 문화를 가진 조직은 그렇지 않은 조직에 비해 두 자릿수 성장률을 보일 가능성이 3배 정도 높다고 한다. 데이터 컬처를 가진 조직은 더 나은 결정을 더 빨리 내릴 수 있다. 2020년 MIT CDO 및 정보 품질 심포지엄에서 데이터 중심 문화를 가진 기업은 "수익 증대, 고객 서비스 개선, 동급 최고의 운영 효율성 및 수익성 개선"을 이루었다고 한다. 또한 데이터 컬처 조직은 최고의 직원을 채용하고 유지하는 데 도움이 되는 부가 효과가 있다. 유능한 직원일수록 사내 정치가 지배하거나 암묵적 합의를 추구하는 문화에서 일하기보다는 논리적인 데이터가 결정하는 곳에서 일하기를 선호하는 것이다.
마지막으로, 데이터 중심 문화는 조직을 관리하는 데 필요한 충성도를 증가시킨다. 업무의 방향이 상위자의 지시에 따라 실행되는 권력 문화에서는 여러 새로운 도전을 할 때 그것을 지지하는 구성원들의 동의와 지원을 받지 못하면 그 시도는 실패한다. 데이터 컬처 조직이라면, 의사 결정 배경의 데이터와 분석 결과를 공유함으로써 기업 계획을 실행하는 데 전념할 수 있으며, 그 비즈니스의 성공 가능성을 높일 수 있다. 이런 장점을 갖춘 데이터 컬처를 구축하려면 조직에서 다음의 세 가지 기능을 활성화해야 한다.
첫 번째는 데이터 검색 및 발견이다. 이것은 조직 구성원이 어떤 의사 결정을 필요로 할 때 관련 데이터를 적시에 찾을 수 있어야 한다는 의미이다.
두 번째는 데이터 활용 능력이다. 구성원은 논리적 결론을 도출하기 위해 데이터를 올바르게 해석하고 분석할 수 있어야 한다.
세 번째는 데이터 거버넌스이다. 기업 조직은 데이터가 적절하게 관리되어 직원이 올바른 방식으로 데이터를 사용할 수 있도록 하는 가이드와 표준을 정하고 관리해야 한다.
IDC에 따르면, 2020년에 전 세계에서 64제타바이트 이상의 데이터가 생성, 캡처 및 소비되었다고 한다. 원시 데이터의 양뿐만 아니라 데이터 레이크, 클라우드 데이터 웨어하우스에 이르기까지 모든 형태의 데이터를 저장하기 위한 데이터베이스 시스템 유형도 동시에 증가하고 있다. 예전의 기업은 올바른 비즈니스 결정에 필요한 충분한 데이터가 없었다고 할 수 있지만, 지금의 조직은 차고도 넘치는 데이터를 갖고 있다. 즉 예전의 질문이 "데이터가 있습니까?"였다면 지금은 "올바른 데이터는 어떻게 찾나요?"가 데이터 컬처를 위한 질문이 된다. 또한 원하는 데이터가 여러 시스템과 여러 가지 형식으로 존재할 수 있다는 점을 감안할 때 가장 올바른 질문은 "사용할 수 있는 많은 데이터 중에서 가장 좋은 것을 어떻게 찾습니까?"가 될 수 있다.
데이터 검색 및 발견은 사용자가 데이터 기반 의사 결정을 내리는 데 필요한 정보를 찾고, 이해하고, 신뢰할 수 있도록 하는 기능이다. 데이터 검색 및 발견은 데이터 컬처의 베이스가 된다. 사람들이 필요한 데이터를 찾을 수 없다면, 기업에 데이터 거버넌스가 확립되어 있는지 또는 데이터 활용 능력이 뛰어난 직원인지는 중요하지 않게 된다. 데이터 검색 및 발견은 광범위하게 정의되어야 할 필요가 있다. 사용자가 원시 데이터뿐만 아니라 비정형 정보 데이터, 로컬 텍스트 문서, 문서화되지 않은 프로세스 등을 포함하여 광범위한 정보 자산을 찾고, 그 정보에 대해 이해하고 신뢰할 수 있도록 해야 한다.
데이터를 이해한다는 것은 데이터 자산에 대해 더 많이 알고자 하는 노력을 의미한다. 예를 들어, 사용하는 데이터의 의미는 무엇이고, 어디에서 왔으며, 관리자는 누구이고, 이 데이터를 사용하는 다른 사람은 누구이고, 또 다른 부가가치를 위해 어떤 데이터와 결합하는가 등이다. 데이터를 신뢰한다는 것은 주어진 데이터 자산을 사용할 수 있는지 여부와 방법을 아는 것을 의미한다. 이 데이터는 정확하고 가장 최근의 것인지, 누가 이 데이터에 접근할 수 있고, 어떤 데이터 정책이 필요한지 등에 대한 답을 내릴 수 있어야 신뢰성이 생긴다. 또한 이렇게 데이터를 이용하는 형태는 상호 보완하고 상승하는 선순환 효과로 더 큰 이점이 얻어진다.
◎ 더 많은 사람이 사용할수록 시스템이 더 좋아진다. 지식을 제공하고 사용 패턴이 관련성에 대한 경험을 남긴다.
◎ 시스템이 좋아질수록 더 많은 사람이 사용한다. 콘텐츠와 검색 결과의 품질이 향상되면 새로운 사용자가 자동 유입되기 때문이다.
이렇게 선순환 추진력을 갖게 되면 데이터 컬처를 위한 동력이 더 좋아진다. 데이터 검색 및 발견 시스템은 데이터 거버넌스에도 활용되어 데이터의 적절한 관리와 정책을 준수하게 된다. 예를 들어 데이터 개인 정보 보호 담당자는 전화번호 데이터의 모든 사용 예를 찾아 개인 식별 정보로 레이블을 지정할 수 있다. 데이터 거버넌스를 위해 특별히 구축된 시스템은 분석적인 최종 사용자를 만족시키지 못하는 경향이 있지만 정보를 찾는 사람들을 위해 구축된 일반적인 시스템은 데이터 거버넌스를 훨씬 효율적으로 실행할 수 있게 해 준다. 바로 이 이유가 데이터 검색 및 발견 시스템이 모든 데이터 컬처의 기본이 된다는 사실이다.
데이터 활용 능력은 데이터를 읽고, 작업하고, 분석하고 그것에 대해 따질 수 있는 능력이다. 이것을 이해하기 위해선 단계별 접근이 필요하다.
첫 번째 단계는 ‘데이터 분석’이다. 데이터 활용 능력의 시작은 여러 기술과 도구를 사용하여 데이터를 분석하는 능력이다. 이 단계에서도 많은 기술과 역량이 필요하지만, 전체 데이터 활용 능력의 기본일 뿐이다. 즉, 이 단계에서 역량을 구축하는 필요한 작업을 가볍고 단순하게 생각하는 것이 아니라 데이터 컬처를 시작하는데 이런 분석 기술과 데이터 액세스 역량은 필수적으로 갖추어야 한다는 것을 말한다. 이 단계가 충실하게 진행되지 않으면, 데이터 세트를 이용하여 시각화하는 것은 올바르지 않은 인사이트를 만들 수 있다.
두 번째 단계는 ‘결론 도출’이다. 데이터 활용 능력의 다음 단계는 데이터로부터 정확한 결론을 도출하는 것이다. 다양한 데이터 소스와 분석 기술 중 상황에 맞는 솔루션을 선택하여 비즈니스 질문에 올바른 결론을 도출할 수 있어야 한다. 이를 위해서는 주어진 질문 유형에 어떤 기술이 가장 적합한지 판단하고, 데이터와 분석의 한계를 이해하고, 합리적인 추론을 방해할 수 있는 수많은 형태의 인지 편향에 대해 인식하고 경계해야 한다.
다음은 데이터 활용 능력 계층의 최상위 단계인 이해관계자를 설득하는 능력이다. 탁월한 분석 기술을 가졌다 해도 이해관계자를 설득할 수 없다면 그 데이터가 만든 통찰력은 가치가 하락한다. 데이터를 이용한 설득은 데이터를 적절하게 시각화하는 단계에서 출발하여 데이터 중심 디자인을 하고, 데이터를 사용한 스토리텔링이 완성될 때 효과를 발휘한다. 다른 사람을 설득하려면 정보를 명확하게 알고 신뢰할 수 있으며 설득력 있는 설명을 할 수 있어야 한다. 이해관계자들을 데이터로 설득하는 방법이 자리 잡은 조직에서는, 개인 경험에 근거한 회의적 태도나 근거 없는 데이터 불신 같은 조직 생산성 저해 요소를 최소화할 수 있다.
데이터 활용 능력은 사람들이 데이터에 대해 논쟁할 수 있게 하는 것뿐만 아니라 데이터를 사용하여 만들어진 잘못된 주장에 대해서도 부담 없이 논쟁할 수 있도록 하고 권한을 갖는 것이다. 데이터 컬처는 조직 내 데이터에 접근할 수 있는 구성원과 그렇지 않은 구성원 간의 정보 불균형을 해결한다는 의미에서도 데이터 활용 능력이 중요하다.
기업 내에서 데이터 활용 능력의 진정한 목표는 모든 부서에서 데이터를 사용하여 조직의 성공을 위한 더 나은 결정을 내릴 수 있도록 모든 사람이 데이터에 액세스할 수 있도록 하는 것이다. 단순히 숫자, 그래프, 차트를 읽는 것이 아니라 다양한 시각적 표현에서 유용한 의미를 추론하며 그 데이터를 더 쉽게 소비할 수 있는 것이다. 조직의 모든 사람이 데이터에 더 능숙해지도록 돕는 것이 목표라면 그 방법과 핵심 요소는 어떤 것인지 살펴보자.
조직에서 강력한 데이터 리더가 될 사람과 데이터 활용 능력 프로그램을 만드는 데 도움을 줄 수 있는 구성원 그룹을 찾는다. 이 그룹은 데이터 가치를 확신하지 못하는 사람들에게 데이터 활용 능력의 이점을 옹호할 수 있는 팀이다. 데이터를 효과적으로 사용하지 않아 기회를 놓치고 있는 조직 내 그룹을 파악하고 데이터 활용 능력 프로그램 우선순위를 정하는 역할을 한다.
조직의 모든 문화를 데이터 중심의 요구 사항으로 만드는 전환이 시작되어야 한다. 회사 리더가 데이터 기반 의사 결정을 모델로 하고 팀의 구성원들에게 똑같이 하기를 요구하면 문화가 바뀐다. 데이터 성공 사례를 조직 내에서 적극적으로 공유 홍보하여 데이터의 힘을 이해하도록 하는 부분은 필수적이며, 데이터가 실제 사업 결과에 어떤 영향을 미치는지 쉽게 확인할 수 있어야 한다.
조직 전체에서 데이터를 효과적으로 공유할 수 있는 시스템이 구축되어 있지 않다면 데이터 과학자와 분석가가 업무 효율을 올리는데 병목 현상이 발생하게 된다. 모든 직원이 데이터에 액세스할 수 있는 방법과 도구를 도입한다. 도구와 상관없이 비 기술자가 데이터를 조작하고 스스로 가장 중요한 정보를 추출할 수 있는 시스템을 제공해야 한다.
모든 직원에게 데이터에 대한 액세스 권한을 부여하는 것은 확실히 데이터 활용 능력의 중요한 단계이지만 직원이 데이터를 사용하지 않는다면 별로 도움이 되지 않는다. 직원들은 데이터 활용 능력이 회사의 성공에 얼마나 중요한지 이해해야 한다. 비즈니스 목표 달성에 데이터가 얼마나 중요한지 이해하는 사람들은 데이터 해석 방법에 대한 추가 교육에 적극적으로 된다. 비판적 사고와 데이터 기술에 대한 교육은 조직의 데이터 컬처를 성숙시키는 중요 요소이다. 모든 직원이 다음과 같은 질문을 쉽고도 자연스럽게 할 수 있어야 한다.
· 데이터 수집 방법
· 데이터에서 배울 수 있는 가치
· 정보의 신뢰성
데이터는 항상 사실을 나타내고 있지만, 그 해석과 분석에서 편향이 도입될 수 있고, 잘못 표현될 수 있으며, 데이터의 표본 크기가 너무 작아서 전략적 결정을 내리기 어렵거나, 데이터를 신뢰할 수 없게 만드는 여러 경우가 있다. 데이터에 대해 분석적으로 생각하도록 훈련된 사람들은 이러한 문제에 대해 질문하는 방법을 안다. 또한 데이터 유출을 방지하기 위해 데이터의 안전한 취급과 그 윤리 지침에 대해 정기적인 교육이 필요하다.
데이터 활용 능력을 성공적으로 향상한 조직은 이것이 반복적인 프로세스의 결과라는 것을 인식한다. 어떤 그룹이 교육이 필요한지 우선순위를 정하고, 첫 번째 그룹의 경험을 다음 그룹에 적용한다. 효과가 있는 것과 그렇지 않은 것에 대해 그룹으로부터 피드백을 받아 가며, 프로세스와 교육 내용을 다듬어 나감으로, 더 효과적이 되도록 한다.
데이터 거버넌스는 조직 내에서 데이터를 수집하고 사용하는 방법을 정의하고, 다음과 같은 핵심 질문을 다룬다.
· 조직의 비즈니스에서 데이터를 어떻게 정의하는가?
· 데이터는 어디에 존재하는가?
· 사용 가능한 데이터는 얼마나 정확해야 하는가?
· 누가 사용할 수 있는가?
· 어떻게 사용할 수 있는가?
이러한 질문은 데이터의 라이프사이클 기간 중 최고 품질의 데이터를 유지하려는 거버넌스 규칙 및 원칙에 대한 정보를 제공한다. 데이터 거버넌스는 데이터 품질과 정확성을 개선하기 위한 기반을 만든다. 가트너는 정보 거버넌스를 "정보의 가치 평가, 생성, 저장, 사용, 보관 및 삭제 과정에서 그 행위를 보장하기 위한 의사 결정 권한 및 최종 책임 한계를 설명한다. 여기에는 조직이 목표를 달성할 수 있도록 정보를 효과적이고 효율적으로 사용하도록 보장하는 프로세스, 역할 및 정책, 표준 및 메트릭이 포함된다”고 정의한다.
간단히 말해서, 데이터 거버넌스는 데이터에 대한 규정을 준수하는 인간의 행동을 규정한다. 데이터 기반 의사 결정을 위한 프레임워크를 만들고, 데이터 작업 방법에 대한 명확한 기대치를 설정하면 데이터를 중심으로 한 프로세스의 품질이 향상되고 신뢰가 구축된다. 데이터 거버넌스를 통해 얻는 이점은 다음과 같다.
• 더 나은 분석: 데이터 거버넌스가 데이터 품질과 검색 가능성을 향상하므로 분석 전문가는 규정에 따라 데이터를 더욱 신속하게 찾고, 이해하고, 분석할 수 있다.
• 일관된 규정 준수: 데이터 거버넌스는 데이터 사용자가 규정을 준수하도록 지원하여 금전 피해 및 명예 손상에 대한 위험을 줄여준다.
• 데이터 관리 개선: 거버넌스는 중복 작업을 최소화하여 운영 효율성을 높인다.
• 표준화된 시스템 및 데이터 정책: 조직 전체의 시스템 및 정책을 표준화함으로써 사용자에게 데이터 사용에 관한 윤리 의식을 조성한다.
• 향상된 데이터 품질: 데이터 거버넌스를 준수함에 따라 생성되는 데이터의 품질이 향상되고, 이는 더 정확해진 프로세스와 높은 신뢰감을 생성한다.
데이터 거버넌스는 사용자가 더 높은 품질과 정확성을 달성하기 위해 동일한 지침을 따르도록 요구하고, 데이터 사용에 관한 새로운 법률 및 규정에 대응하는 유연한 프레임워크를 제공한다. 또한, 조직 전체에 유사한 데이터 사용 프로세스를 설정한다. 이것은 서로 다른 프로세스로 인해 데이터 품질과 정확성이 다를 수 있기 때문에 이 설정은 중요하다. 이 프로세스가 적절하게 구현되면 데이터 거버넌스 프레임워크는 조직 내 구성원의 데이터에 관한 행동을 통일할 수 있을 뿐만 아니라 구성원 스스로 그 규정을 이해하는 데 도움이 된다. 즉 투명한 거버넌스 프레임워크는 데이터 프로세스의 이면에 있는 이유를 명확히 한다. 이러한 투명성은 신뢰를 구축하고 사람들이 시스템을 이해하도록 하여 기업 내에서 데이터 사용에 관한 통일된 컨센서스 즉 데이터 컬처를 만든다.
▶ 해당 콘텐츠는 저작권법에 의하여 보호받는 저작물로 기고자에게 저작권이 있습니다.
▶ 해당 콘텐츠는 사전 동의 없이 2차 가공 및 영리적인 이용을 금하고 있습니다.
SAP France의 Senior Program Manager
한국에서 컴퓨터 공학을 전공 후, 7년간 한국후지쯔에서 개발자로 근무하고, 1998년 프랑스 파리로 이주하여 Business Objects에서 개발 매니저와 프로그램 매니저를 거쳐, 현재 SAP의 클라우드 ERP 엔지니어링 그룹의 시니어 프로덕트/프로그램 매니저로 근무 중입니다. 책 <프로덕트 매니지먼트>의 저자입니다.