ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 머신러닝 잡페어로 쏘카 데이터 엔지니어가 된 하디 이야기, "천천히 달리기"
    취업 이야기/합격자 인터뷰 2020. 7. 29. 17:58

    그저 운이 좋은 사람으로 보기에는 목표를 향해 쉬지 않고 달려온 5개월 차 데이터 엔지니어 인터뷰

    2019년 12월에 진행된 ‘머신러닝 온라인 잡페어’를 통해 쏘카 데이터 그룹에 합류한 하디를 만났습니다. 쏘카에 합류하기까지의 과정과 입사 이후 쏘카 생활에 대한 이야기를 들어보세요. :)

    쏘카 데이터 엔지니어링 팀, 데이터 엔지니어 하디

    “ 쏘카 데이터 그룹의 데이터 엔지니어링 팀에 있는 하디입니다. 올해 3월에 프로그래머스 채용을 통해서 입사했어요.”


    Track 1. 최종 합격까지 달리기

    프로그래머스 머신러닝 온라인 잡페어는 이력서도 내고 데이터 분석 과제도 제출하는 채용 프로젝트였어요. 어떻게 참가하게 되셨나요?

    프로그래머스는 취업 준비할 때 코딩 테스트를 문제를 풀기 위해 종종 들어가는 사이트였어요. 어느 날 메인에 머신러닝 온라인 잡페어가 떴는데, 컴퓨터 비전과 추천 시스템 두 가지 분야가 있더라고요. 마침 추천 시스템을 공부하려던 때라 이 대회로 동기 부여 하자는 마음으로 참여했습니다. 정말로 취업까지 하게 될 줄은 몰랐어요.

    데이터 엔지니어가 백엔드 개발자와 비교하면 상대적으로 채용이 아주 적은데, 취업 준비할 때 어렵진 않으셨어요?

    처음부터 데이터 엔지니어로 취업하겠다는 생각은 못했어요. 왜냐하면 이 직무로 신입을 뽑는 회사가 거의 없어요. 저는 8학기를 마치고 취업까지 1년 정도 걸렸어요. 취업 준비 기간의 4분의 3을 데이터 분석 직무로 취업을 준비했고 잘 되지는 않았습니다. 나머지 기간은 직무를 바꿔서 백엔드 엔지니어로 취업을 준비했어요. 머신러닝 잡페어를 통해 지원한 포지션은 데이터 분석이었어요. 백엔드 엔지니어로 방향을 바꿔서 일 년 정도 더 준비해야겠다 다짐했을 쯤에 마지막으로 넣은 이력서였는데 그게 된 거죠. 그리고 면접을 진행하다가 데이터 엔지니어 포지션에 지원해보는 것이 어떻겠냐는 제안을 받아서 그때 처음으로 지원하게 되었어요.

    혹시 입사하고 나서 채용 비하인드를 들으셨나요? 어떤 면을 보고 데이터 엔지니어를 제안했을까요?

    네. 있었어요. 합격하고 나서 다 물어봤죠. 데이터 엔지니어 신입 잘 안 뽑는데 저 왜 뽑으셨냐고. 들어보니까 쏘카 데이터 그룹의 데이터 엔지니어가 백엔드 엔지니어 업무와 데이터를 다루는 업무가 합쳐져 있어요. 저는 데이터를 분석한 경험도 있고, 학부 때의 개발 경험도 있어서 지금 하고 있는 프로젝트와 잘 맞겠다 싶어서 뽑으셨다고 해요.

    그렇다면 이력서에는 주로 어떤 내용을 쓰셨어요?

    지금까지 해온 것을 다 썼어요. 3학년 때 스타트업에서 겨울 인턴으로 일을 했을 때 데이터 관련 개발도 해보고 분석에 관심이 생겼던 것과 그 이후로 공부를 더 해서 큰 회사에서의 분석을 해본 것, 네이버에서 주최하는 데이터 분석 대회에 참여한 것도요. 그 과정들을 블로그에 글로 꾸준히 올렸더니 블로그를 통해서 연락이 와서 또 다른 일을 할 기회도 생겼어요. 그런 경험들이 이력서에 적었어요.

    그래서 이력서를 보면 엔지니어스러운 것이 별로 없어요. 전부 다 분석했고, 분석했고, 분석했다는 내용인데, 그래도 데이터 엔지니어가 되고 싶은 이유는 명확했어요. 지금까지 데이터 분석을 해왔는데, 해보니까 분석보다는 엔지니어가 잘 맞아요. 그래서 엔지니어 하려고요. 그런 내용이에요.

    데이터 분석은 이제 미련 없으신가요?

    네. 미련 없어요. 그냥 취미로 해요.

    여러 가지 경험 중에서 개발 실력이 확 늘었을 때는 언제였나요?

    스타트업에서 겨울 인턴으로 일 했을 때요. 무급 인턴이었는데도 재미있었어요. 학교에서는 개발을 기술로만 배우니까 이게 왜 등장하는지, 왜 써야 하는지 생각이 잘 안 나거든요. 그런데 실제 문제에 대해 생각을 하고 검색을 해보니까, 개발에 대한 이해가 높아지고 실력도 팍팍 늘었어요.

    쏘카 채용 절차에는 전화 면접이 있어요. 전화 면접 경험자로서 처음인 분들을 위해 팁을 준다면 무엇이 있을까요?

    첫 번째로 장소는 조용한 곳이 가장 좋아요. 저는 낮에 신촌에 있는 스터디 카페 같은 곳에서 전화 면접을 했어요. 두 번째는 눈에 보이지 않는 면접관님과 나누는 대화가 생각보다 편합니다. 세 번째 팁은 노트북을 앞에 들고 있어야 합니다. 질문이 훅 들어왔는데 갑자기 기억이 안나는 것들이 있어요. 알고 있지만 약간 애매한, 예를 들면 통계 지식 같은 것이요. 그런 질문을 받았을 때 빨리 검색해보는 것이 도움이 돼요.

    취업 과정이 진짜 길기 때문에 단 한 곳이 최종 확정되기까지 많이 불안한 시간을 겪잖아요. 그동안 마인드 컨트롤은 어떻게 하셨나요?

    회사를 붙는 것은 굉장히 운이 따라야 하기 때문에 되면 좋고 안돼도 더 잘 준비해서 하면 된다고 생각했어요. 왜냐하면 개발자는 공부할 것들이 항상 많잖아요. 머신러닝 잡페어에 지원한 것도 취업해야지라는 마음도 있었지만, 그것보다는 경험해보고 싶었어요. 추천 시스템은 제가 굉장히 잘하는 분야가 아니었거든요. 나는 내 할 일을 꾸준히 하면 된다, 할 것은 엄청 많다고 생각했어요.


    Track 2. 쏘카에서 데이터 엔지니어로 달리기

    입구가 멋진 쏘카

    직무 이야기를 해볼게요. 쏘카에서 어떤 일을 하세요? 

    데이터 엔지니어의 첫 번째 업무가 데이터를 복제하는 일이에요. 일반 시스템의 백엔드 엔지니어가 다루는 입력 데이터가 사용자의 클릭이나 이벤트라면, 제가 다루는 데이터는 시스템이에요. 더 설명을 하면, 서비스 환경에는 일반적으로 서버가 있어요. 그런데 데이터를 분석할 때 서버에 쌓인 데이터를 바로 이용하면 안 돼요. 왜냐하면 실제 운영 중인 데이터들이고, 사용자에 의해 인터랙티브 하게 바뀌니까요. 그래서 시스템에 있는 데이터를 분석할 수 있는 별도의 환경으로 복제합니다. 데이터를 복제한다고 하면 ‘아 그렇구나’ 할 수도 있지만 기술적으로 생각해야 할 것들이 있거든요. 예를 들어 서비스 시스템은 AWS(Amazon Web Services)를 쓰는데, 쏘카 데이터 그룹은 GCP(Google Cloud Platform)을 쓰고 있는 상황도 그렇죠.

    두 번째로 기존의 데이터를 합쳐서 새로운 지표를 만들어내는 일을 해요. 분석에 필요한 데이터를 만들어놨어요. 그런데 이 데이터를 단순히 복제해오는 것 말고 잘 조합해서 의미 있는 데이터를 만들고 싶은 거예요. 사용자의 예약 로그와 차량이 움직이는 가동 시간 데이터를 조합해서 가동률 수치를 만들어 낼 수 있죠. 이런 것을 보고 '오늘 쏘카가 얼마나 운영이 되었네?'라는 비즈니스 지표로 사용할 수 있어요.

    그럼 쏘카에서 가장 재미있는 데이터는 무엇인가요? 앞으로 해보고 싶은 것은요? 

    일반적인 대답이긴 하지만 쏘카에서 가장 재미있는 데이터는 이동 데이터예요. 평일에는 주로 어디를 가는지, 휴일에는 주로 어디를 가는지 알 수 있어요. 최근 팀원 분이 사람들이 휴일에 어디를 자주 가는지 분석했는데, 경기도의 개성집을 많이 간다고 나왔어요. 그런 데이터를 보면 왜 많이 갈까? 여기가 진짜 맛집인가 하는 궁금증이 생겨요.  

    *쏘카의 데이터를 설명한 발표자료(2019) 보기

    또 재미있는 데이터는 쏘카존의 가격 시스템이요. 쏘카는 존마다 차량마다 가격이 다 달라요. 저는 데이터 그룹에서 가격 시스템을 다루거든요. 데이터를 취합하면 어디가 수요가 높고, 어디가 수요가 낮은지 볼 수 있어요. 현재의 가격은 사업 본부가 결정하는데, 앞으로 사람이 하는 일을 자동화하고 싶어요. 가격 시스템에서도 아직 최적화나 자동화할 것들이 많거든요. 

    평소 개발 공부는 어떻게 하세요?

    분야가 생기다 보니 공부해야 할 것이 너무 많고, 공부를 할 수밖에 없어요. 취업 준비할 때보다 더 많이 공부해요. 퇴근하고 강의를 듣거나 내 의지만으로 안될 것 같은 것은 회사 분들과 스터디를 하고 있어요.

    쏘카 자랑도 해주세요. 입사 후에 직접 경험해보니 더 좋은 점은 무엇이 있을까요? 

    사내에서 동료들과 함께 스터디, 세미나를 많이 해요. 그 문화가 정말 좋아요. 그리고 교육비를 지원받기 때문에 사람들이 공부하고 싶은 것들을 하고 ‘나 이런 거 공부했어’하고 다시 회사로 들고 오는 편이죠. 위치적으로는 지하철과 가까운 것이 좋아요. 출퇴근이 생각보다 편해요. 가까운 곳에 밥 먹고 산책 갈 수 있는 서울숲이 있는 것도 좋습니다. 핍스(PEEPS)라고 2주에 한번 다른 팀과 점심을 먹는 제도가 있어요. 이 날은 점심시간이 2시간이에요. 75% 쏘카 직원 할인을 받아서 차 타고 멀리 나가서 점심을 먹기도 해요.

     


    Track 3. 함께 달리기

     신입 데이터 엔지니어가 되고 싶은 후배들이 많아요. 해주고 싶은 말이 있다면요?

    데이터 엔지니어 모집 요강을 보면 학부생이 쫄만한 단어들이 많이 나와요. Spark, Kafka, Hadoop 이런 것들이요. 그런데 또 내가 적용될 만한 것들도 있어요. 파이썬 잘하는 사람 우대, 컴퓨터 공학 지식이 탄탄한 사람 우대와 같은 조건들이 있죠. 할 수 있는 것들 위주로 쫄지말고 많이 경험해 보시면 좋겠습니다. 흔히 컴퓨터 공학의 기본이라고 하는 운영체제, 자료구조, 네트워크, 소프트웨어 공학, 데이터베이스 이런 것들을 회사에 들어가서 단기간에 빨리 배워지지 않기 때문에, 탄탄하게 공부해두면 면접 때 잘할 수 있습니다. 언어 하나를 잘 다루는 것도요.

    그리고 데이터 엔지니어를 왜 하고 싶은지 많이 생각해보셨으면 해요. 나만의 이유가 있으면 좋아요.

    마지막으로 서버든 프론트엔드든 자신이 처음부터 끝까지 프로젝트를 해보세요. 신입 엔지니어의 경우 태도나 관심과 열정을 확인할 수 있는 증거들 위주로 보거든요. 가고 싶은 회사의 도메인과 꼭 일치하지 않더라도 개인적으로 어떤 프로젝트를 했고 어떤 부분을 고심했는지 흔적이 남아 있으면 좋습니다. 그런 면에서 기록이 중요한 것 같아요. 저는 면접 볼 때 블로그를 다 보여드렸어요.

    실제로 블로그의 도움을 많이 받았나요?

    제 블로그에 굉장히 기술적인 내용이 들어가는 것은 아니에요. 주로 생각들을 정리했는데, '이 사람이 정리를 잘하네?'라는 인상을 줬던 것 같아요. 그리고 블로그에 엔지니어가 왜 되고 싶은지를 쓰여있어요. 그 글을 보고 '이래서 이 일을 하고 싶어 하는구나', '자신에 대한 생각을 많이 했구나'라고 봐주셨다고 생각해요.

    긴 인터뷰 감사합니다. 마지막으로 한 말씀 부탁드려요.

    요즘이 취업이 어려워요. 당장 취업이 안 돼도 꾸준히 공부하다 보면 기회는 계속 있습니다. 저는 데이터 분석 직무로 취업을 포기하고 다시 취업을 준비할 때 딱 1년을 더 준비하자고 생각했었어요. 너무 초조해하지 않고 길게 바라보면 됩니다.

     

     


    Bonus Track. 쏘카 데이터 엔지니어의 하루

    데이터 엔지니어의 진-짜 일상이 궁금한 분들을 위해, 답변을 바탕으로 재구성했습니다.

    쏘카 데이터 엔지니어의 하루(feat. 내가 생각하는 프로그래머의 삶.txt)

    아침 8시 기상
    시차 출퇴근제[1]라 9시 30분까지 출근할 계획이었지만 조금 늦게 일어남
    슬랙에 “10시 출근하겠습니다"라고 쓰고 30분 늦게 출발

    집에서 과일과 요거트를 섞어서 간단한 식사

    한 시간 동안 지하철 2호선을 타고 뚝섬역 5번 출구에 내림
    30분 늦게 나온 덕에 편-안 한 출근길

    10시에 데이터 엔지니어링 팀 스크럼 참석
    팀원들과 업무를 공유

    오전 업무를 하다보니 어느덧 점심시간

    12시 20분쯤에 밥을 먹으러 나감
    뚝섬 일대의 맛집을 찾아서 점심 식사 후 서울숲 산책[2]
    예쁜 카페에서 커피를 사서 들어옴

    오후에 데이터 그룹 세미나[3] 참석
    업무 시간에 공부하니 학습 효율도 오르는 것이 느껴짐

    띠링
    슬랙에 올라온 개인 세미나 공지
    동료가 이번에 10강짜리 머신러닝 강의를 준비 중

    퇴근 후 동료들과 파이썬 스터디

    다시 한 시간 동안 2호선을 타고 집에 도착

    동네에서 운동

    회사에서 지원받는 교육비[4]로 결제한 강의에 접속

    [1] 8시 30분, 9시, 9시 30분, 10시 중 출근 시간을 선택하는 제도. 최근에는 코로나19로 8시, 10시 30분도 선택 가능

    [2] 쏘카 - 서울숲 실제로 5분 거리

    [3] 주기적인 데이터 그룹 세미나, 데이터 엔지니어링 팀 세미나, 개인 세미나(OO 스쿨, 본인 이름 뒤에 스쿨이 붙음.)가 있음. 그룹 세미나와 팀 세미나는 필참, 개인 세미나는 관심 있는 사람만 참석

    [4] 교육비 무제한.

    산책하기 좋은 서울숲
    쏘카에서 바라본 뚝섬역 전경


     

    댓글

Programmers