• 미디어 >
  • 엔코아 리포트
Weekly Brief
[조회수 : 2457]  다운로드
나는 이렇게 데이터 과학자가 되었습니다 - 1

[나는 이렇게 데이터 과학자가 되었습니다 - 1]


2012년, 하버드 비즈니스 리뷰(Harvard Business Review) 선정 21세기 가장 섹시한 직업 데이터 과학자(Data Scientist)


미국에서는 2년 연속으로 가장 인기 많은 직업 1위 자리를 지키고 있지만 우리에게는 아직 낯선 직업 임에 틀림없다. 생긴지 얼마 되지 않은 직업이기도 하거니와 국내에서는 각 종 데이터 관련 규제로 인해 데이터 산업이 활성화 되지 못하고 있기 때문에 기업들은 데이터 과학자에 대한 정확한 업무 정의와 역할을 제시하지 못하고 있는게 현실이다. 


1.png


[엔코아, 공감토크 11회 나는 이렇게 “데이터 과학자”가 되었습니다]


이유는 간단하다. 기업이 다양한 데이터 융합을 통한 통찰력을 경험해보지 못했기 때문이다.


기업 내부 데이터의 품질 관리는 투자 우선 순위에서 밀리고, 공공 데이터의 오픈률은 세계 최고이나 활용률은 밑바닥이고, 소셜 데이터는 양도 많지 않은데다 그나마 필요한 관련 기술은 퇴보하고 있으며, 데이터 혁명을 위해 가장 중요한 요소인 경쟁사 및 파트너 데이터를 사용 할 수 있는 방법은 법적으로 막혀 있기 때문이다. 


하지만, 최근 글로벌 기업 순위의 상위 랭킹을 데이터 기반 혁신 기업들이 채워 나가면서 생각보다 빠른 속도로 국내 시장이 반응하고 있다. 지난 해는 의료 데이터 관련 규제였던 DTC(의료기관을 거치지 않고 소비자가 직접 검사 의뢰)가 허용 되었고, 개인정보보호 비식별화 조치 가이드라인도 나왔다. 이외에도 다양한 규제의 장벽들이 조금씩 무너지면서 열리게 될 데이터가 연결되는 세상. 즉, 4차 산업혁명의 시대가 눈앞에 보이기 시작한 것이다.


왜? 우리가 이 시대를 이해하지 못하고 선점하지 못했는지에 대한 원인이 밝혀지고 있는 것이다.


디지털 네이티브(native) 세대인 우리 학생들은 기성세대가 놓친 4차 산업혁명 시대의 주도권과 상관 없이 다가올 미래를 준비하고 싶어한다. 하지만, 어디서부터 시작해야 할지 무얼 공부해야 할지 국가와 시장이 국내 현실에 맞는 명확한 길을 제시하지 못하고 있는게 현실이다. 


- “제가 지금 맞게 가고 있는게 맞나요?”
- “뭐부터 공부해야 하나요?”


엔코아가 데이터 과학을 주제로 <멘토링 스쿨>과 <공감토크> 콘서트를 진행하며 학생들에게 가장 많이 들었던 질문이다. 많은 학생들이 데이터 과학자를 꿈꾸지만 비슷한 고민을 하고 있다. 시작하는 학생들은 어디서부터 시작 해야 하는지를 고민하며 이미 공부를 많이 해 온 학생들도 자신들이 맞는 길을 가고 있는지에 대한 의문을 품고 있다.


이번 엔코아 리포트는 2회에 걸쳐 데이터 과학을 공부하는 학생들에게 엔코아 데이터 과학자들이 어떤 길을 걸어왔는지 소개한다. 각각 다른 배경과 방법으로 데이터 과학자가 된 4명의 컨설턴트의 경험담이 여러분들에게 도움이 되길 바래본다.


* 이번 엔코아 리포트는 2월 24일에 있었던 공감토크 11탄의 강연내용을 요약하였습니다.


1. 식품영양학도에서 데이터 과학자로


- 데이터 과학, 따로 또 같이



2.png

 
 [박세진 컨설턴트의 이력, 언뜻 보면 데이터 과학과 전혀 관계없는 길을 걸어온 것 같다]


박 컨설턴트는 식품영양학과를 졸업하고 박사과정까지 수료했다. 위의 이력을 보면 전혀 데이터 과학과 관계없는 일을 해 온 사람 같지만 사실 그의 이력을 조금만 더 살펴보면 그렇지 않다.
 

3.png


[생물정보학을 공부하며 프로그래밍과 통계 지식을 쌓음]


박 컨설턴트의 시작은 “왜”라는 호기심에서 출발했다고 한다. DNA가 갖고 있는 데이터에 매력을 느껴 통계학과 컴퓨터 기술을 활용해 생물 정보를 효과적으로 분석하는 일에 흥미를 갖게 되었고, BIO와 IT를 접목하는 생물정보학bioinformatics)을 공부하게 되었다. 생물정보학을 공부하다 보니 직접 데이터를 가공하며 프로그래밍을, 통계적 실험 설계를 배우며 통계지식을 쌓게 되었고 이는 모두 데이터 과학을 위한 밑거름이 되었다.


- 치열하게 준비한 자만 잡을 수 있는 기회

 

4.png


[박세진 컨설턴트가 쌓아온 지식과 경험들, 모두 데이터 과학자로서의 소양이 되었다]


박 컨설턴트는 계획한대로 준비한 미래는 아니었다고 이야기한다. 처음부터 데이터 과학자를 위해 준비해 온 일은 아니었지만 쌓아온 지식과 경험은 모두 데이터 과학자로서의 소양이 되었다. 매 순간 치열하게 준비해왔기에 기회가 왔을 때 잡을 수 있었던 것이다.


- 데이터 과학 공부 어디서 시작하면 좋을까?

박 컨설턴트는 다른 전공에서 시작한 만큼 부족한 부분을 채우기 위해 다양한 수업과 스터디로 노력해왔다고 이야기한다. 여기 박 컨설턴트가 경험하고 느낀 다양한 공부법을 정리해 보았다. 학생, 취업 준비생, 직장인 각자의 상황과 위치에 맞는 공부법을 선택해 보도록 하자.


[데이터 과학자가 되기 위한 맞춤형 공부 방법]

5.png


위의 공부 전략을 보면 알겠지만 공부와 경험의 균형이 중요하다. 배우고 익히는 것의 균형을 잘 맞춰야 온전히 자신의 것으로 잘 만들 수 있다.

 

6.png


[어떤 공부전략을 고를 것인가에 대해 고려해 볼 사항]


또한 어떤 전략을 고를지에 대해서는 위의 그림을 보며 자신의 조건과 목적에 맞는 전략을 잘 선택해 봐야 할 것이다. 또한 이 모든 과정의 산출물을 기록으로 남겨두면 후에 유용하게 사용이 가능하다.


- 따로 또 같이, 작은 성공의 경험을 쌓아가라


7.png
[엔코아 멘토링 스쿨 4기 멘티 선발 및 조구성]


위의 표는 얼마 전 수료한 엔코아 데이터 과학 멘토링 스쿨 4기의 조구성이다. 각 조는 데이터 과학 프로젝트를 수행할 수 있는 팀 구성에 초점을 두고 다양한 전공의 학생들을 선발했다. 팀 또한 다양한 전공의 학생들로 구성되었다.


여기서 우리는 데이터 과학자 팀이 얼마나 다양한 분야의 인원들로 구성되는지 엿볼 수 있다. 팀원을 선출했던 기준은 문제 해결을 위한 최적의 구성에 두었다. 기술력, 시장분석 경험, 인문학적 소양, 통계학적 지식 등 기업이 필요한 다양한 데이터 기반의 접근이 용이할 수 있는 인력풀로 구성해보려 노력했다


많은 학생들이 자신이 특정전공이 아니어서 불리할 것이라고들 많이 생각한다. 하지만 데이터 과학 팀은 다양한 모양의 블록이 쌓여 만들어지는 하나의 집처럼 다양한 구성원이 필요한 팀이다.


때로는 혼자서 지식을 쌓기도 하고, 때로는 함께 스터디를 해나가며 ‘따로 또 같이’ 작은 성공의 경험을 쌓아 나가길 바란다. 박 컨설턴트는 데이터 과학자용100% 맞춤형 블록은 없다고 말한다. 각자 자신만의 블록을 스스로 만들어 나가야 한다.



2. 데이터 과학자를 꿈꾸는 인문계 친구들에게



엔코아의 사회공헌 프로그램인 <멘토링 스쿨>이나 <공감토크>의 참가 학생 비율을 보면 80%이상이 인문계 학생들이다. 많은 인문계 학생들이 데이터 과학자를 꿈꾸지만, 프로그래밍 등의 진입장벽과 어떻게 인문계의 장점을 살려야 할지를 몰라 어려움을 겪고 있다.

김용연 컨설턴트는 경영학과를 졸업하고 빅데이터 대학원 석사를 졸업한 컨설턴트로 본인의 경험을 바탕으로 인문계 학생들의 어려움에 대해 이야기 한다.


- 어떤 프로그래밍 언어를 배울 것인가?


많은 인문계생들이 처음 부딪히는 문제는 어떤 프로그래밍 언어를 배울 것 인가다. 김 컨설턴트는 우선 프로그래밍 언어를 왜 배워야 하는지에 대해서부터 생각해보자고 이야기 한다.
 

8.png


[영화 컨텍트 중, 프로그래밍 언어를 언어라고 생각해보자]


프로그래밍 언어는 컴퓨터와 나누는 대화다. 데이터 과학자는 컴퓨터와 프로그래밍 언어를 통해 소통해야한다. 프로그래밍 언어를 배움으로써 보고 느끼는 것이 달라질 것이다. 이게 데이터 과학자가 프로그래밍 언어를 배워야 하는 이유이다.


그렇다면 어떤 프로그래밍 언어를 배워야할까?


알(R)은 활용도는 좋은데 큰 데이터는 돌릴 수 없다고 하더라. 자바(JAVA)의 점유율은 계속 높아지고 있는데 너무 어렵다더라. 파이썬(Python)은 쉬운데 분산 처리가 안된다더라… 이런 식으로 제대로 하나를 써보지도 않고 이 언어 저 언어 여러가지를 고르다가 지치는 경우가 많다.


김 컨설턴트는 처음 시작할 때는 남들이 많이 쓰는 언어를 배우라고 추천한다고 조언한다.

남들이 많이 쓰는 언어를 배우면 주변에 함께 할 수 있는 이들이 많아지기에 배우기 쉬운 장점이 있다. 반면 남들이 잘 쓰지 않는 언어를 쓰는 경우 배우기는 어렵지만 나만의 희소가치를 가질 수 있는 장점이 있다.

그래서, 처음 접근은 오픈소스이면서 많은 사람들이 공부하고 있는 툴인 R을 추천한다고 덧붙였다.


- 기술을 쫓지 말고 가치를 찾아라


김 컨설턴트는 처음 대학원에 입학해서는 인문계인 본인의 단점을 채우기 위해 더 기술에 매달렸다고 말했다. 기술에 치중하며 대학원 초반을 많이 보냈지만 어느정도 기술을 익히자 더 큰 의문이 생겼다.


9.png
 
[검은색 화면과의 전쟁이었던 대학원 초반 생활]


내가 기술로 어디까지 차별화 될 수 있을까? 그리고 이 기술을 어디에 활용해야 할까?
이 시점에서 깨달은 점이 기술을 익히는 것보다 기술을 활용하는 것이 더 중요하다는 점이었다.

돈을 모으고 어떻게 관리하는지도 중요하지만 올바르게 쓰는 것도 중요하듯 데이터 역시 모으는 것도 중요하지만 올바르게 쓰여질 때 빛난다는 것을 다양한 프로젝트를 통해 깨달았다.


- 새로운 시각으로 가치를 찾아낸 사례들


그렇다면 기술이 아닌 새로운 시각으로 가치를 찾아낸 사례들이 어떤 것이 있을까? 우리는 지금까지 신선하지 못한 빅데이터 활용사례들을 많이 봐왔었다. 이번에는 좀 신선한 빅데이터 활용 사례들을 살펴보며 기술이 아닌 가치를 찾는 것의 중요성을 알아보려 한다.


명함 정리 어플 리멤버

 10.png


[명함자동인식 어플 리멤버]


리멤버는 사진을 찍으면 사진 속 명함 정보를 자동으로 핸드폰에 저장해주는 명함 자동인식 어플로 시작한 어플리케이션이다. 처음엔 명함을 수기 입력 하는 등 기술적으로는 그렇게 새롭지 못한 서비스였다. 하지만 이제 축적된 명함 데이터로 새로운 서비스를 개발하고 있다.


 11.png


[축적된 데이터를 이용한 리멤버의 새로운 서비스 개발]


단순 명함 인식 어플에서 시작한 리멤버는 이제 축적된 데이터로 문자인식 기술까지 개발하고 있다. 또한 명함을 통한 네트워킹 데이터를 활용 인맥관리 서비스와 전화번호부 서비스까지 개발하고 있다.


IoT 옷걸이


IoT옷걸이는 기존 매장 옷걸이에 IoT센서를 부착해 새로운 데이터를 얻어낼 수 있게 된 사례다.


 12.png

[기존 매장 옷걸이에 센서를 부착함으로써 소비자 구매성향까지 알 수 있게 되었다]


기존 매장에서는 “소비자가 어떤 옷을 구매했다”는 단순 구매 데이터가 전부였다. 하지만 옷걸이에 센서를 부착함으로써 소비자들이 해당 옷을 몇 번이나 선택 했었는지 등의 IoT데이터가 추가로 수집되게 되며 소비자의 구매성향을 파악할 수 있게 되었다.


위의 두 사례 모두 놀라운 신기술이 도입된 것이 아닌 새로운 시각을 통해 가치를 찾아낸 사례들이다. 기술을 발견하는 것보다 어떻게 활용하는지에 대한 고민이 더 중요한것임을 알 수 있는 대목이다.


- 인문계생만이 가질 수 있는 경쟁력을 기르자


인문계생이 데이터 과학자가 될 수 있을까? 된다면 어떤 경쟁력을 가져야 할까?
많은 데이터 과학자를 꿈꾸는 인문계 학생들이 가지는 의문일 것이다.


김 컨설턴트는 말한다.

“인문계생인 우리가 프로그램이나 통계학 능력으로는 차별화 될 수 없을지도 모른다. 우리는 문제에 대한 다른 접근으로 가치를 찾아내는 경쟁력을 가져야만 한다. 그것이 바로 데이터 과학팀에서 인문학도가 필요한 이유이다.”


13.png


[데이터에서 가치를 찾아내기 위해 길러야 할 소양]


 데이터에서 가치를 찾아내는 인문학도만의 경쟁력을 길러야 하며 그를 위해 김 컨설턴트는 통찰력, 넓은 시야, 호기심 이 세 가지 소양을 이야기했다. 이는 데이터 과학자의 기본 소양과도 닿아 있다며 무엇보다 많은 사람들을 만나면서 시각을 넓힐 것을 강조했다.



※ 다음 리포트에서는 나는 이렇게 데이터과학자가 되었습니다-2”를 다룹니다.

EN-CORE_Report_2017.03.07(나는이렇게데이터과학자가되었습니다1).pdf




목록