Tableau(태블로)
데이터분석가가 알아야하는 Tableau(태블로)
Tableau란?
데이터 분석할때 중요한 것 중에 하나가 바로 시각화이다. 데이터 시각화란 데이터를 표,그래프 등으로 표현하는 것을 말한다.
가장 대표적인 데이터 시각화 도구는 Excel을 들 수 있지만 데이터 양이 점점 많이지고 시각화해야할 분석들이 많아지면서 Excel만으로는 시각화 하는데 한계가 있다.
그래서 요즘에 Tableau를 데이터 엔지니어,분석가,사이언티스트들이 많이 쓰는 것 같아서 나도 Tableau 공부를 시작해야겠다고 생각했다. 직전 회사에서는 Python을 이용해서 시각화한게 전부였는데 사실 Python은 분석 도구이지 시각화 도구가 아니기 때문에 분석결과를 정확하게 시각화 하는데에는 한계가 있었다.
Tableau의 장점
1. 편의성과 빠른 시각화 속도
2. 인터렉티브 시각화
3. 내장된 분석 기능 (기초 통게부터 ARIMA 예측까지 제공하고 있음)
Tableau를 사용하는 이유
- 개인 관점 : 시간 절약
- 팀 관점 : 신속한 의사 결정
- 기업 : 데이터 기반 기업 문화 정착
주요기능
- Tableau Prep 데이터 결합/정리/변형
- Tableau Desktop 분석/시각화
- Tableau Online/Server 데이터 공유
사용자 그룹
- Creator - 데이터 전처리/시각화 분석
- Explorer - 웹 상에서 편집/ ad hoc 분석
- Viewer - 데이터 조회/ 열람
<태블로 기능="" 및="" 사용자="" 그룹="">태블로>
데이터 업로드 및 조작
-
태블로 연결 - 태블로 내부 데이터
-
파일 연결 - 엑셀, JSON,PDF 등
-
서버 연결 - Cloudera hadoop / google bigquery / Amazon EMR / Mongo DB 등
Tabpy
-
tableau를 활용하다 보면 현황을 차트로 표현하여 보여주는 것에서 나아가 예측, 클러스터링 등과 같이 머신러닝을 활용한 조금 더 심도 깊은 분석에 대해서도 시각화 하고 싶은데 Python으로 코드를 돌려 그릴 수도 있지만 내가 원하는 형태와 디자인으로 차트를 빠르게 그리기가 쉽지 않고 대시보드 내에서 사용가가 인터렉티브하게 분석결과를 바로바로 볼 수 없는 아쉬움이 있는데 이 부분을 가능하게해주는 것이 바로 Tabpy이다.
-
Tabpy를 활용하면 태블로에서 파이썬 코드가 실행되어 결과 값을 시각화 된 형태로 바로 확인이 가능하다.