데이터 직무 (직무 구분, 취업 준비, 포트폴리오)

데이터 직무를 처음 준비할 때 저는 SQL과 Python만 배우면 충분하다고 생각했습니다. 하지만 채용 공고를 여러 개 비교해 보니 데이터 엔지니어, 데이터 분석가, 데이터 사이언티스트, BI 분석가는 같은 데이터를 다루더라도 맡는 역할이 전혀 달랐습니다. 데이터를 모으고 흐르게 만드는 일, 수치의 원인을 찾는 일, 예측 모델을 만드는 일, 의사결정자가 보기 쉽게 정리하는 일은 각각 다른 역량을 요구했습니다. 저는 이 차이를 모르고 준비하면 스펙은 쌓이지만 방향은 흐려질 수 있다고 느꼈습니다. 이 글에서는 제 경험을 바탕으로 데이터 직무가 왜 세부 역할로 나뉘는지, 그리고 취업 준비 방향을 어떻게 잡아야 하는지 정리해 보겠습니다.

데이터 직무 구분이 생긴 이유

데이터 직무가 여러 이름으로 나뉘는 이유는 데이터가 실제로 활용되기까지의 과정이 생각보다 길기 때문입니다. 서비스에서 데이터가 생성되는 순간부터, 저장하고 정제하고, 분석하고 예측하고, 의사결정으로 연결되기까지 각 단계마다 필요한 역할이 다릅니다. 예를 들어 쇼핑몰 하나만 봐도 클릭 로그는 로그 서버에, 결제 내역은 주문 DB에, 고객 정보는 회원 관리 시스템에 흩어져 있습니다. 이 데이터를 한 곳으로 모으고 쓸 수 있게 만드는 것 자체가 이미 별도의 전문 역할입니다. 분석가가 좋은 인사이트를 내려면 그전에 데이터가 제대로 쌓여 있어야 하고, 데이터가 잘 쌓이려면 파이프라인이 먼저 구축되어야 합니다. 여기서 데이터 파이프라인이란 여러 곳에서 발생하는 데이터를 수집하고 정제해 분석 시스템으로 자동으로 흘려보내는 구조를 의미합니다. 이 구조가 없으면 분석가는 매번 직접 데이터를 긁어오는 데 시간을 다 씁니다. 제가 직접 채용 공고를 뜯어보면서 느낀 건, 같은 데이터라는 단어가 붙어 있어도 요구하는 역량 목록이 직무마다 완전히 달랐다는 겁니다.
각 직무가 맡는 핵심 질문을 정리하면 다음과 같습니다.

데이터 엔지니어: “데이터가 제대로 흐르고 있는가?”
데이터 분석가: “이 수치는 왜 이렇게 나왔는가?”
데이터 사이언티스트: “앞으로 어떤 일이 일어날 가능성이 높은가?”
BI 분석가: “의사결정자가 한눈에 볼 수 있는가?”
비즈니스 분석가: “이 결과로 무엇을 바꿔야 하는가?”

이 질문들을 보면 직무 구분이 회사의 편의가 아니라 실제 책임 범위의 차이에서 비롯된다는 게 명확해집니다. 국내 IT 기업들의 채용 동향을 보면 데이터 엔지니어와 데이터 분석가의 채용 비중이 꾸준히 높아지고 있습니다(출처: 한국고용정보원).

직무별 취업 준비 방향

SQL과 Python은 거의 모든 데이터 직무의 공통 기반입니다. 하지만 솔직히 이건 예상 밖이었는데, 도구가 같아도 그걸 어떻게 쓰느냐가 직무마다 완전히 다릅니다. 데이터 엔지니어는 ETL 작업을 설계하는 데 SQL을 쓰고, 분석가는 지표를 추출하는 데 씁니다. 여기서 ETL이란 Extract(추출), Transform(변환), Load(적재)의 약자로, 데이터를 원본 시스템에서 꺼내어 필요한 형태로 바꾼 뒤 분석 저장소에 넣는 일련의 과정을 말합니다. 이 과정에 오류가 생기면 이후 분석 결과 전체가 흔들리기 때문에 데이터 엔지니어에게는 핵심 업무입니다. 데이터 사이언티스트 방향을 준비한다면 머신러닝 모델 개발과 통계적 가설 검정 역량이 필요합니다. 여기서 통계적 가설 검정이란 수집된 데이터가 특정 가설을 지지하는지 확률적으로 판단하는 방법으로, 실험 결과나 이벤트 효과를 검증할 때 필수적으로 활용됩니다. 제 경험상 이 부분을 그냥 넘기고 모델 코드만 짜는 식으로 준비하면 면접에서 바로 걸립니다. BI 분석가나 비즈니스 분석가 방향이라면 Tableau나 Looker 같은 시각화 도구 활용 능력과 함께, 대시보드 구성 의도를 설명하는 능력이 중요합니다. 단순히 예쁜 차트를 만드는 게 아니라 어떤 지표를 왜 보여줘야 하는지를 설명할 수 있어야 합니다. 국내 데이터 직군 취업 시장에서 BI 관련 직무는 핀테크, 이커머스, 게임 분야에서 수요가 높은 편입니다(출처: 사람인).

포트폴리오 기준

포트폴리오를 만들 때 가장 많이 하는 실수가 직무 구분 없이 “데이터 분석 프로젝트”라고만 써내는 겁니다. 제가 직접 채용 담당자 후기나 공고를 비교해 보니, 이런 포트폴리오는 어느 직무에도 설득력 있게 읽히지 않더라고요. 직무별로 포트폴리오의 포인트가 분명히 다릅니다. 데이터 엔지니어라면 데이터 웨어하우스 구축이나 파이프라인 자동화 사례를 보여줘야 합니다. 여기서 데이터 웨어하우스란 분석 목적으로 다양한 소스의 데이터를 통합해 저장해 두는 중앙 저장소를 뜻합니다. 단순 DB와 달리 분석 쿼리에 최적화된 구조로 설계되는 것이 특징입니다. 이 개념이 포트폴리오에 녹아 있어야 데이터 엔지니어를 뽑는 면접관 눈에 띕니다. 데이터 분석가 포트폴리오는 문제 정의에서 결론까지 이어지는 흐름이 있어야 합니다. “이 지표가 왜 떨어졌는지”를 추적한 분석 과정, 그리고 그 결과를 어떻게 해석했는지가 핵심입니다. 저는 이 부분이 데이터 분석 직무의 진짜 실력을 보여주는 지점이라고 생각합니다. SQL 쿼리를 잘 짜는 것만큼이나 “왜 이 데이터를 봤는가”를 설명하는 능력이 훨씬 중요합니다. 데이터 사이언티스트라면 모델을 만들었다는 사실보다 모델의 성능을 어떻게 평가하고 개선했는지를 보여줘야 합니다. 여기서 모델 평가 지표란 분류 정확도, 정밀도, 재현율처럼 예측 모델이 얼마나 잘 작동하는지를 수치로 측정하는 기준을 말합니다. 높은 정확도만 내세우는 포트폴리오보다 문제 상황에 맞는 지표를 선택하고 개선 과정을 기록한 포트폴리오가 훨씬 설득력 있습니다. 제 경험상 이 차이를 아는 것만으로도 준비 방향이 훨씬 선명해집니다.

데이터 직무를 준비하고 있다면 지금 당장 채용 공고 열 개를 열어보는 것을 권합니다. 직무명보다 “주요 업무” 항목을 먼저 읽어보면, 기업이 원하는 역할이 파이프라인 구축인지 지표 분석인지 예측 모델링인지 조금씩 보입니다. 그 차이를 파악하는 순간, SQL 하나 더 배우는 것보다 방향이 먼저 잡힙니다. 저는 데이터 직무를 하나로 묶어서 준비하는 게 가장 시간을 낭비하는 방식이라고 생각합니다. 내가 데이터의 어느 단계에 흥미가 있는지부터 확인하는 것이 가장 빠른 준비입니다.