[독서메모] 데이터 분석을 위한 SQL 레시피

데이터공부기록/SQL

[독서메모] 데이터 분석을 위한 SQL 레시피 | 2장 3강 시스템

팔랑팔랑마음 2023. 7. 27. 10:06

※ 본 게시글은 한빛미디어의 '데이터 분석을 위한 SQL 레시피(가사키 나가토, 다미야 나오토 지음)'에서 발췌한 내용이며

학습 목적으로 요약 정리한 메모입니다.

HDFS(Hadoop File System, 분산 파일 시스템) 위의 데이터를 SQL스러운 인터페이스로 간단하게 처리해주는 시스템
분산 파일 시스템 위의 데이터의 순서를 맞추는 MapReduce라는 알고리즘 사용
장점:
- 무료
- 쿼리 실행 때 동적으로 데이터를 정의할 수 있음
단점:
- 리액턴시가 낮은 처리를 요구하는 경우에는 적합하지 않음
- 파일 기반의 시스템 > 레코드 변경 및 제거가 어렵고 쿼리 실행 때 파일 전체를 조작해야 함

구글이 제공하는 클라우드 서비스
사용 시간이 아닌 읽어 들인 데이터의 양으로 비용 계산
컬럼 지향 스토리지 아키텍처
장점:
- 다루는 데이터가 적으면 적은 비용으로 운용 가능
- 직접 노드 인스턴스를 관리할 필요 없음
- 유료 구글 애널리틱스와 연동 가능
단점:
- 사용 요금을 예측하기 어려움 > 자주 읽어들이는 데이터만 모아서 별도의 테이블로 분할 or 필요한 컬럼만 SELECT 구문으로 가져오기

[독서메모] 데이터 분석을 위한 SQL 레시피 \| 3장 5강 (0)	2023.07.28
[SQL] COUNT(*)와 COUNT(column_name)의 차이점 (0)	2023.07.07
[SQL] 맨날 헷갈리는 BETWEEN 포함 범위 총정리 (0)	2023.07.07

커다란 나무도 처음엔 새싹🌱

위클리회고, HR Analytics, 주간회고, sql, 데이터분석, sql레시피, 데이터분석책, 5F, TIL, 피드백, 이재진, 데이터마케팅, HR 애널리틱스, HRA, 양승화, HR 애널리스트, 회고, 데일리회고, 그로스해킹, 마케팅추천책,