0. 준비 사항
사용 기술
•
Hadoop HDFS, MapR
•
MySQL
•
Hive
•
Airflow
1. 데이터 생성
2. 차원 모델링
•
생성한 데이터셋을 통해 다양한 분석 시나리오를 가정하여 차원 모델을 설계
•
차원 데이터의 변경을 반영하거나 계층 구조를 가진 데이터를 효과적으로 적재하도록 설계
3. DW 구축
•
Hive에 DW를 구축하고 HiveQL을 통해 테이블 파티셔닝을 진행
4. ETL 계획
•
데이터를 알맞은 과정으로 적재하기 위해 ETL 시퀀스를 계획