데이터 분석 전문가를 만나다! <브라이틱스와 함께하는 데이터 분석> 저자 인터뷰
삼성SDS와 IT에 대한 다양한 소식을 전하는 삼성SDS 뉴스룸. 지난 뉴스룸 기사에서는 IT 시대에 각광받는 직업 데이터 사이언티스트에 대해 소개해드렸습니다.
+ 데이터로 세상을 분석한다! 데이터 사이언티스트
기사를 통해 데이터 사이언티스트가 되기 위한 준비 과정과 활용 분야를 알아봤는데요. 이번 기사에서는 콘텐츠 제작에 참고했던 도서 ‘브라이틱스와 함께하는 데이터 분석’을 집필한 삼성SDS 직원들과 함께 데이터 사이언티스트와 도서를 주제로 이야기해보겠습니다.
Q. 안녕하세요! ‘브라이틱스와 함께하는 데이터 분석’ 도서 소개 부탁드립니다!
이지현 Senior Engineer 삼성SDS 소셜 팬 여러분 반갑습니다! 저희가 집필한 ‘브라이틱스와 함께하는 데이터 분석’은 Brightics Studio(브라이틱스 스튜디오)를 활용해 데이터 처리부터 고급 분석 알고리즘까지 데이터 사이언스의 전 과정을 쉽게 따라 할 수 있도록 기획된 책입니다.
데이터 분석 입문자부터 실제 분석 업무를 수행하는 실무자까지 데이터 사이언스에 관심 있는 독자들을 대상으로 하고 있습니다. 각 분야의 이론적인 설명과 다양한 예제를 함께 제공하고 있어 Brightics Studio를 활용해 분석하는 분들에게 길라잡이가 될 것입니다.
Q. ‘브라이틱스와 함께하는 데이터 분석’에서 실습 도구로 소개된 ‘Brightics Studio’에 대해 간단히 설명해 주세요.
이영선 Senior Consultant Brightics Studio*는 삼성SDS에서 만든 오픈소스 분석 플랫폼으로, 데이터 처리는 물론, 통계 분석, 머신러닝, 딥러닝을 활용한 분석과 시각화 기능을 제공합니다. 워크 플로(workflow)를 통해 분석 프로세스를 한눈에 알아볼 수 있도록 구성할 수 있으며, Drag&Drop 방식의 UI(User Interface)로 사용자가 보다 쉽게 데이터 분석을 수행할 수 있고, 분석 결과를 리포트로 정리할 수도 있습니다.
대용량 데이터 분석 플랫폼 Brightics AI의 오픈소스 버전으로, 비전문가도 머신러닝 등 데이터 분석에 필요한 기능을 별도 코딩 없이 쉽게 사용할 수 있는 삼성SDS 분석 플랫폼
Q. 도서 ‘브라이틱스와 함께하는 데이터 분석’에서 각각 어떤 파트를 집필하셨나요?
박현경 Principal Data Scientist 저는 책의 전체적인 기획부터 데이터 분석 시작하기, 데이터 전처리, 통계분석, 머신러닝 내 회귀분석 실습 등을 담당했고, 이지현 Senior Engineer는 데이터 전처리 일부, 머신러닝의 추천 및 군집분석 등을 집필했습니다.
또한, 머신러닝의 개념과 분류 및 회귀 일부, 딥러닝 부분은 서범준 Senior Engineer가 집필했으며, 머신러닝 내 차원 축소, 회귀분석, 통계분석 내 시계열분석 파트는 이영선 Senior Consultant 담당했습니다.
Q. 데이터라는 주제를 풀어내기 쉽지 않았을 텐데, 책을 쓰게 된 계기나 과정에서 어려움은 없었나요?
박현경 Principal Data Scientist 2018년 여름부터 처음 책의 목차를 뽑고, 함께 작성할 저자들을 모으고 그동안 모아놨던 자료들만 추리면 하면 금방 책 한 권이 써질 거라 생각했는데, 밀려오는 과제와 강의를 수행하며 집필과 교정 작업이 순탄치는 않았습니다.
실습 부분에 대해 모델 워크플로를 어떻게 하면 일목요연하게 보여줄 수 있을지, Brightics의 큰 화면을 책의 작은 공간에 어떻게 효과적으로 보여줄 수 있을지도 고민이 필요했습니다. 그리고 저자마다 문체나 톤 등의 스타일이 달라서 전체적으로 통일하기 위해 상당한 노력을 필요로 했습니다.
원고를 채우는데 1년, 문체 통일과 세세한 교정작업에 1년 정도 걸렸습니다. 주말을 활용해 집필과 교정 작업을 많이 했는데, 생각보다 작업 시간이 길어지면서 주말까지 일하는 모습에 가족들의 원성도 사야 했지만, 저자들이 서로 힘이 돼 2년이라는 긴 시간 동안 집필할 수 있었습니다.
Q. 최근 데이터 분석의 중요성과 활용도가 커지면서 데이터 분석에 대한 책이 많이 출간됐는데, 저자로서 이 책의 경쟁력을 꼽는다면 무엇이 있을까요?
서범준 Senior Engineer 이 책의 경쟁력은 데이터 분석에 관심 있는 누구나 쉽게 분석을 시도할수 있게 한다는 점입니다. Brightics는 분석의 흐름을 이해하기 용이한 구조와 사용자 친화적인 환경으로 쉽게 데이터 분석을 경험할 수 있게 합니다. 하지만 처음 접하는 사람이라도 Brightics를 사용하기 위해서는 가이드가 필요한데 지금까지 참조할만한 서적이나 문서가 부족했던 것이 사실입니다. 이 책을 통해 분석 전반을 이해하고, 실습 기반으로 상세하게 설명된 Brightics 분석 방법을 터득하면 누구나 분석가로 첫 발을 내디딜 수 있습니다.
Q. ‘브라이틱스와 함께하는 데이터 분석’ 책을 출간하며 느낀 점이 있나요?
서범준 Senior Engineer 데이터 분석에 익숙치 않은 독자도 이해할 수 있도록 집필하면서 제 스스로도 정리가 많이 된 느낌입니다. 집필 활동을 통해 오히려 제 역량 향상에 도움이 됐고, 무엇보다 제 이름이 들어간 책이 생겼다는 뿌듯함이 가장 크게 느껴집니다. 부족하지만 독자들에게 많음 도움이 됐으면 좋겠습니다.
이지현 Senior Engineer 도서에 들어갈 내용을 글로 정리한다는 것이 쉽지 않은 일이라는 것을 느끼게 되었고 이번 과정을 통해 이론을 정리할 수 있는 시간이 돼 좋았습니다. 책 출간 자체도 소중한 경험이라는 생각이 듭니다.
이영선 Senior Consultant 회사에서 Brightics를 활용해 분석을 하고 싶었던 임직원과 Brightics Studio를 이용하는 분들에게 간접적으로나마 도움을 줄 수 있다는 생각에 뿌듯함을 느낍니다.
박현경 Principal Data Scientist 데이터 분석 프로젝트와 강의를 하면서 그 경험을 살린 책 한 권을 출판하는 것이 꿈이었는데, 그 꿈을 이룬 것 같아 좋습니다. 원고를 작성하며 이론에 대한 정리도 하고, Brightics Studio의 다양한 기능을 활용해 보고 베타 리더 후기를 받으면서 지인들에게 피드백을 받을 수 있어서 좋았습니다.
Q. 삼성SDS에서 데이터 사이언티스트로 근무하고 계신데, 데이터 분석 전문가가 갖춰야 할 필요 역량과 자질에는 어떤 것이 있을까요?
이지현 Senior Engineer 호기심이 많은 사람이 데이터 분석가로서 성공할 확률이 높다는 말이 있습니다. 새로운 알고리즘이나 데이터 탐색 자체에 대한 호기심과 분석을 위한 기초 지식을 쌓는 것이 중요한 것 같습니다.
이영선 Senior Consultant 수학적 지식, 통계 모델에 대한 이해, 컴퓨터 프로그래밍, 모두 필요한 자질임에는 틀림없습니다만, 개인적으로 데이터 분석 전문가가 갖춰야 할 필수 자질은 창의력과 끈기라고 생각합니다. 데이터 분석에는 정해져 있는 방법이 있는 것이 아닙니다. 동일한 데이터라도 다양한 방식으로 접근할 수 있기 때문입니다. 그렇게 때문에 본인의 창의력을 최대한 발휘해서 접근해야 좋은 분석 결과를 얻을 수 있는 것 같습니다.
끈기 또한 중요합니다. 한때 데이터 마이닝이라는 용어가 유행이었던 적이 있었는데요, 저는 이 마이닝이 데이터 분석의 큰 줄기를 차지하는 용어라고 생각합니다. 광부가 금을 캐기 위해 끝까지 파내는 끈기를 보여 주는 것처럼, 데이터 분석에서도 의미 있는 데이터들을 찾아내기 위해 광부의 근성이 필요할 때가 많기 때문입니다.
Q. 데이터 사이언티스트로 일하시면서 데이터 분석에 관련된 기억에 남는 에피소드나 프로젝트가 있나요?
이영선 Senior Consultant 데이터 분석 전문가에게 있어 본인이 만들어 낸 모델들과 분석 결과는 모두 내 자식 같은 느낌이 있습니다. 내가 만든 모델이 잘 활용되고 찾는 사람들이 많아질 때 보람을 느끼곤 합니다. 또 모두가 어렵다고 생각했던 일을 분석을 통해 해결할 때도 희열이 있습니다.
서범준 Senior Engineer 분석 관련 업무를 십 년 이상 해오고 있지만 저 역시 보람을 느낄 때는 제가 만든 분석 모델이 잘 사용되고 있을 때입니다. 단기 분석으로 끝나는 경우도 있지만 적용한 분석 모델이 몇 년째 회사에서 잘 사용돼 성과를 내고 있다는 이야기를 들으면 힘들었던 순간이 다 잊힐 만큼 기분이 좋습니다.
근래에는 사내∙외에서 분석 강의를 진행하고 있는데, 학생들이 열심히 수업을 들을 때나 제자들이 성장이 느껴질 때 다른 의미로 큰 보람이 있습니다. 특히 데이터 분석을 잘 모르던 학생이 강의를 들은 후 관심을 갖고 노력해 분석 능력을 인정받아 취업하게 되었다고 감사 인사를 보냈을 때는 누군가의 인생에 좋은 영향을 줄 수 있었다는 사실에 뿌듯했습니다.
박현경 Principal Data Scientist 저는 이커머스 CRM(Customer Relation Management) 프로젝트를 수행할 때 겪었던 에피소드가 생각납니다. 운영서버로 들여왔으나 아직 운영 전인, 당시의 고성능 서버에서 분석을 시작했었습니다.
프로젝트 진행 중에 그 서버는 어느덧 운영을 시작했고, 저는 1억 건이 넘는 트랜잭션 데이터에 대해 추천 알고리즘을 실행했습니다. 결과 나오기를 기다리고 있던 참였는데, 운영서버 담당자가 달려와서 누가 지금 큰 작업 돌렸냐며 쇼핑몰 장애나게 생겼다고 큰소리로 외치는 것을 들었습니다. 가슴 철렁했던 그 기억이, 십여 년이 지난 지금도 잊을 수가 없습니다.
Q. 마지막으로 데이터 사이언티스트를 꿈꾸는 독자에게 한 말씀해주세요.
이지현 Senior Engineer 예전에는 데이터 분석이라고 하면 한정적인 전공을 가진 분들이 하는 일로 생각했으나 지금은 다양한 전공의 많은 분들이 데이터 사이언티스트 꿈을 가지고 있고 실제로도 많이 활동하고 있습니다. 본인이 갖고 있는 다양한 장점을 통해 이 분야에서 활용되고 있는 지식들을 습득해 나가면서 자신의 길을 걸어나가면 좋은 데이터 사이언티스트가 될 수 있을 것이라 생각합니다.
박현경 Principal Data Scientist 인기 프로그램 ‘복면가왕’을 보면 출연자가 어떤 배경과 경험을 가졌으며 어떻게 생겼는지는 전혀 관심사가 아닙니다. 오직 ‘실력’에만 집중을 합니다.
데이터 분석도 마찬가지입니다. 본질에 집중해 데이터 감이 있고 분석을 잘 수행한다면 전공과 그동안의 경험, 배경의 중요성은 상대적으로 약해지는 것 같습니다. 불과 10년 전만 해도 분석 프로젝트는 전공자 위주로 수행되었지만 이제는 그렇지 않으니까요. 데이터 분석에 대해 흥미가 있고 열정이 있으며, 앞으로도 이 분야에 빠져들 자신이 있다면 그것으로 이미 준비가 된 것입니다. 이제는 이 분야에 더욱 깊숙이 들어와 심취할 때입니다.
데이터 분석과 데이터 사이언티스트에 대한 이번 기사 어떠셨나요? 데이터 분석은 IT 관련 전공자만 할 수 있는 업무라 생각했는데 이번 인터뷰를 진행해보니, 브라이틱스와 함께하는 데이터 분석' 도서로 공부하고 삼성SDS Brightics를 사용하면 어렵지 않게 할 수 있을 거라는 생각이 듭니다.
소셜 팬 여러분들도 데이터 분석에 고민이 있으신가요? 그럼 삼성SDS Brightics를 체험해 보시길 바라면서 이번 기사를 마치도록 하겠습니다!