[후기] DataDay@선릉을 다녀와서

DataDay@선릉을 다녀온 이야기를 공유합니다.

DataDay@선릉

미국 실리콘밸리의 잘나가는 기술기반 스타트업들이 데이터를 활용해 성공적인 마케팅을 진행했다, IT 스타트업의 성공을 위해서는 Growth Hacker가 필요하다, 데이터가 중요하다, 데이터는 어떻게 분석할 수 있을까? 등등의 얘기들이 최근 이슈가 되고 있다. 그래서 데이터 전문가 4명이 진행하는 데이터 관련 모임에 참석하였다. ‘Data’ D의 곡선도 모르지만, 하나씩 배워보고자 한다.

Growth hacking is a marketing technique developed by technology startups which uses creativity, analytical thinking, and social metrics to sell products and gain exposure.(그로스 해킹이란 제품 판매와 노출을 목적으로 기술 벤처 기업에 의해 개발 된 창의성과 분석적 사고, 소셜 분석을 활용하는 마케팅 기법이다.) — Wikipedia

Growth hacking에 대한 더 자세한 사항은 플래텀의 기사 참조.

참여한 모임은 DataDay@선릉

  • 주제: 스타트업 데이터 분석, 무엇이든 물어보세요
  • 패널: 권정민(데이터 분석가), 하용호(데이터 엔지니어), 서하연(지표 전문가), 엄태욱(데이터 프로그래머)

Q&A 형태로 이루어지며 앞에서 진행은 하지만, 다함께 얘기하자를 제안, 서먹서먹 어색어색하게 시작했다. 참여한 분들 중 실제 스타트업이나 기업에서 데이터를 다루는 분들이 꽤 많이 참여했고, 내가 가장 초초초보였던 듯 하다. 스타트업 중에는 데이터를 잘 활용한다는 잘나가는 VCNC, 이음의 멤버 분들도 있었다. 나왔던 질문 중 선별에서 4명의 패널들이 돌아가면서 얘기했으며, 참여하신 분들의 경험을 공유하기도 했다. 나왔던 질문들은 @DataDay에서 볼 수 있다. 또한, 글쓴이가 집중하거나 재미있었던 내용은 오히려 기록이 없을 수도 있으니 그 부분은 이해하시길.

Q: 새로운 데이터를 정의할 때, 향후 1~2년 내에 사용하지 않을 것 같은 데이터를 정의해서 적재하는 것이 괜찮을까요?

돈이 허락하는한 적재하면 좋다. 다 남기기 위해서는 jason 형태로 남겨서 저장하는게 좋다. 추출의 편리성을 위해. 데이터 다루는 사람들도 편견이 MySQL로 저장하면 필드명을 어떻게 해야하지? 임의의 jason 형태로 압축해서 (예를 들면, 테라 용량 수준의 외장형 하드 정도같은 곳에 저장하는 형태로 해보자~) 비용을 쓰는 부서와 데이터를 다루는 부서가 싸우는 경험도 많다. 어떤 회사는 클라우드에 대략 저장해놓기도 한다. 개인정보보호 같은 경우는 클라우드에 저장하면 위반! 당장 필요하지 않고, 사용할지도 모르는 데이터일 경우는, 로그데이터를 날로 사용하는 것을 추천하기도 한다. 개인정보보호법 5분 특강?!은 시간 관계상 아쉽게도 다음 기회에.

Q: 데이터에 과도한 기대를 가진 사람들을 진정시킬 방안은?

데이터 사이어티스트, 엔지니어, 애널릭티스, 아키텍트들이 업무 중에서 작은 성공 케이스틑 만들어내는 방법 뿐인 거 같다. 데이터 분석을 통해 회사의 이득을 얻었음 좋겠다 등등의 부서장의 요구사항들이 있다. 단순하게는 데이터를 가지고 비용을 줄이는 케이스를 만들어라. 노동집약적인 일에 데이터를 활용하여 시스템을 만들 수 있지 않을까? 실제 데이터가 있지 않은 곳에서 … 를 해달라라는 요구를 하는 경우들도 많다. 실제 분석이전에 어떤 데이터가 필요한지에 대해 먼저 짚어주는 것도 필요하다. 데이터란 거대한 무언가라는 편견이 있다. 데이터가 기반에 깔리면, 기업이 건강해진다.

Q: 데이터란 무엇인가요?

데이터는 습관이다. 피터드러커가 말하길, 측정할 수 없으면 매니지할 수 없다. 기록하면 데이터가 되는 거 같다. 행동의 기록이지, 의도의 기록이 아니다. 데이터는 쌓여 있는 기록이다. 어디선가 남겨진 기록이 데이터다.

Q: 스타트업에서 커스터마이즈된 데이터 분석툴을 직접 만드는 것이 비용대비 효과가 있을까요?

분석툴을 만드는 과정에서 배우는게 많다. 세세한 부분까지 신경쓰게 되고, 멤버들과의 합일을 이룰 수있다. 규모에서 오는 효용성이 있다. 외부의 구글애널리틱스과 내부 참조형 두가지 형태로 활용하면 좋을 거 같다. 이음은 데이터 분석들이 내재화 되어 있다. 비트윈은 구글애널리틱스, 플러리 등 다양한 곳에서 데이터 가지고 와서 쓰고 있는데… 직접 만드는 것은 도움이 되나, 운영 코스트가 만만치 않아서 두가지를 활용해서 같이 사용하고 있다. 생각보다 백엔드 분석툴이 잘 죽는다. 그래서 개발자 1명정도인 작은 스타트업인 경우에는 있는 툴들을 잘 활용하는 것도 좋은 거 같다. 엑셀이나 SQL에서 웬만하면 해결이 되니… 데이터를 보는 습관이 먼저 아닌가?! 분석툴이 있어야 하나?! 본질에 집중하는 게 더 중요하지 않나?!

Q: 웹로드 파일 분석 시 bot를 효과적으로 제거할 방법이 있나요?

패턴을 보이면서 들어오는 애들을 차감해 나가는 방법… 노가다성이다. 인자들을 붙여서 사이트(서비스)를 구조를 미리 만들어 놓으면 더 효율적이다?!

Q: 데이터 분석의 활용 예는?

운영, 개발, 사업 3가지의 영역에서 활용할 수 있다.

Q: 데이터 전문가가 없는 스타트업에서 데이터 분석의 역할을 누가 맡아야 할까요?

데이터가 가장 필요한 사람이 해야한다. 데이터들이 꼭 우리 통제하에 나오는 것은 아니다. 동종업계의 이슈나, 사회 이슈들이 생겨서 변화가 생길 수도 있다. A/B 테스트나 등등 데이터만 너무 믿지 마라~ 데이터 분석을 했던 스타트업들이 모여서 Private하게 그들끼리 오픈하면서 얘기하는 자리가 마련이 되면 서로 도움이 되지 않을까? 각 업계(스타트업, 중소기업, 대기업) 사람들이 모여서 얘기하는 자리가 필요하지 않을까?

Q: 데이터 분석을 잘 하기 위해서 알아야 할 지식을 무엇이고, 어떤 성향이 필요한가요?

숫자보기, 데이터의 수집부터 데이터의 유용까지 전반에 걸쳐 아는 것도 중요하지 않을까! 도메인 지식을 아는 것이 중요하다. 린분석 책보면 깔끔하게 정리가 되어 있으니 참고해봐라 기존 분석은 why so? 지금은 분석 성향은 so what? 목적을 두고 데이터를 보는 것이 중요하다.

Q: 데이터를 같이 바라보는 팀에 대해 정리적으로 회의나 모임을 통해 분석해오는 시간을 가지면 도움이 될까요?

Of course!

Q: 지표가 개선되었다는 것은 어느정도 어떤 점이 나아졌을 때 그렇게 볼 수 있나요?

내가 정해서 내가 기준을 잡으면 된다.

Q: Metric을 추출하는데 어려워요.

당연히 어렵다. 내가 보고자 하는 데이터가 메트릭이다. (1)목표값이 명확하지 않을때, 목표값이 있으나, (2)어떤 데이터를 뽑아야 할지 모를때, (3) 데이터가 기록이 되어 있지 않을때, 데이터가 유용한지 모를때, (4) 보고자 하는 바가 너무 많을떄는 우선순위를 정해야 하는게 필요하다. Q: 데이터에 의지하지 말아야 할 떄는 언제일까요? 데이터를 처음부터 의지하면 안된다. 결정에 도움이 될 수 있으나, 그게 전부는 아니다. 데이터는 multiplier 다. 데이터를 가치중립적으로 바라보지 못하고, 의도적으로 바라볼때 오히려 위험하다.

참고로, Data에 대해 잘 정리한 책은 원제 ‘Lean Analytics: Use Data to Build a Better Startup Faster’이 있다.

점점 궁금하고, 재미있어지는 데이터! 이제 데이터란 거대한 무언가라는 편견은 잠시 옆에 내려놓고, 어떻게 활용하여 사업에, 삶에 도움이 될지 본질을 보는 작업을 시작해보자.

데이터에 대한 이해를 돕기 위해서 하용호님과 권정혁님의 슬라이드 참고!

덧붙이는 말: 첨언하거나, 수정 보완이 필요한 부분은 알려주시면 언제나 환영합니다.

댓글 남기기

This site uses Akismet to reduce spam. Learn how your comment data is processed.