Data Analytics (데이터 분석)
[TIL 0625] 데이터 분석이란 무엇일까?
용스토리랜드
2024. 6. 25. 20:28
★데이터 분석가가 하는 일
- 회사의 현 상태를 숫자로 확인하고, 이를 통해 문제정의 및 해결방안을 제시하는 역할을 수행
- 최종적으로는 회사의 이익 개선에 도움이 되는 중요한 역할을 담당한다.
- 회사의 이익 개선 관점에서 어떻게 데이터를 활용할 수 있을지 고민을 해봐야 합니다 !!
- 도메인(산업)에 따라 조금씩 상이하지만 아래 업무를 주로 수행하게 됩니다.
업무 내용 | 업무 상세 |
데이터 추출 | 타 팀으로부터 요청받은 내용을 기반으로 데이터를 추출하여 유관부서에 공유한다. |
데이터 가공 | SQL, Python 을 통해 데이터를 추출한 뒤, 데이터를 전처리 (이상치, 결측치 처리)하고 정합성을 검증합니다. 정합성 : 데이터가 서로 모순 없이 일관되게 일치함. 정합성 검증 예시 : '성별' 컬럼이 '남자'일 때 '주민번호 뒷자리'컬럼의 첫 번째 값이 1또는 3으로 시작. |
데이터 시각화 | 가공한 데이터를 시각화하고 대시보드를 제작합니다. 데이터 시각화 툴 : Tableau, Quicksight (AWS), Power BI (MS) |
인사이트 도출 | 분석보고서를 작성하여, 데이터를 통해 현 시점의 문제제기와 해결방안을 제시합니다. 타 팀에게 이를 공유하여, 비즈니스 전략 수립에 기여합니다. |
★ 데이터분석 역량이 가지는 이점
- 다른 직무와 합쳐질 때 시너지 발생
- 기업의 목표는 '이익창출' 입니다. 이러한 목표 즉, KPI(핵심 성과 지표) 달성을 위해 기업에서는 다양한 실험을 진행합니다.
- 이러한 실험의 결과를 확인하고 비교할 수 있게 해주는 영역이 바로 데이터 분석이기 때문에, 막연하게 'A 프로젝트 보다 B프로젝트가 더 좋은 것 같다' 보다는 데이터에 기반하고, 수치로 정량화하여 설명하는 'A 프로젝트에 비교하여 B 프로젝트의 매출이 N%p 상승했습니다' 라고 말해줄 수 있는 것 !
★데이터란 무엇인가?
- 다양한 정의가 있겠지만 데이터란 컴퓨터에 저장할 수 있는 정보(0 or 1로 기록)라고 이해했습니다. 그 정보에는 다양한 것들이 있을 수 있는데
- 정성적 데이터 : 이미지, 자연어, 음성, 설문(서술형)
- 정량적 데이터 : 수치, 설문(Y/N)
- 데이터 저장창고는 DB(DataBase)
- 저장된 데이터의 모음을 DB 라고 생각하면 된다.
- DBMS(DataBase Management System)
- DB에 접근하기 위한 소프트웨어
- DBMS 란, DB에 규칙성 및 정합성을 부여하여, 데이터 등록/정리/검색이 용이하도록 하는 Software system입니다.
- DBMS 종류 : 관계형, 계층형, 망형
- QUERY : DB에 접근하기 위한 질의 (질문)
- DB에서 정보를 요청하고 결과를 얻기 위해 사용되는 언어 !
- SQL은 RDBMS 에서 데이터를 관리하고 처리하기 위한 표준화된 언어 !
데이터를 분석한다는 것은 Which? What? Why?(3W) 와 How? 의 연속이다.
어떤 문제를 정의하냐에 따라서 무엇을 어떤 방법으로 어떻게 데이터로 해결할 수 있는가를 계속 고민해야 하는 직업이라고 생각합니다.
반응형