일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 | 31 |
- Growth hacking
- 캐글 신용카드 사기 검출
- 컨브넷
- 인프런
- 로그 변환
- 데이터 정합성
- tableau
- 마케팅 보다는 취준 강연 같다(?)
- 스태킹 앙상블
- 데이터 핸들링
- 데이터 증식
- 부트 스트래핑
- lightgbm
- 그룹 연산
- XGBoost
- 그로스 마케팅
- WITH CUBE
- DENSE_RANK()
- python
- 캐글 산탄데르 고객 만족 예측
- splitlines
- pmdarima
- ImageDateGenerator
- 분석 패널
- sql
- 3기가 마지막이라니..!
- 그로스 해킹
- ARIMA
- 리프 중심 트리 분할
- WITH ROLLUP
- Today
- Total
목록시각화/SQL로 분석하고 Tableau로 시각화하자 (18)
LITTLE BY LITTLE
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/c4EmGG/btrHp2be5OB/kAzjB3Iwtsp23wzW9386kK/img.png)
2. 필드 및 뷰 2-1. 필드 변환 : 차원 및 측정값 필드를 활용하여, 시각화에 필요한 새로운 필드로 변환한다. 1. 별칭 [차원] 필드값 변환시 사용 ex. man → 남성 / woman → 여성 2. 계산된 필드 태블로에서 제공하는 함수를 활용해서 필드를 계산 위와 똑같이 계산된 필드 만들기 창에서 '평균 가격' (AVG([Price]) 생성하기 평균 가격 필드를 마크카드 - 텍스트에 드래그하기 3. 그룹 차원 및 필드값 그룹화시 사용하며, 주로 [차원]을 그룹화할 때 사용한다. 4.집합 집합은 차원 필드 값을 집합으로 나눌 때 사용되며, 동적 및 고정 집합으로 2가지가 있다. 동적 집합 : 원본 데이터에 따라 집합이 변경되며, 단일차원만 가능 고정 집합 : 고정된 집합이며, 단일 / 다중 차원이..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bCBFhu/btrHjvdzEMj/mQLkmzgr3P9OWahj1MnJyK/img.png)
Tableau 기본 개념 차원과 측정값 차원 : 분류적인 데이터 - Gender, Brand, Store Address 측정값 : 집계적인 데이터 - Quantity, Price 차원 및 측정값은 숫자,날짜,문자, 지리적인 역할로 데이터 형식 변경이 가능하다. ex. 성별 별 매출액 (분류적인 차원 성별 + 집계적인 측정값 매출액) 하지만 주소나 연령과 같은 값은 차원(분류적인 데이터)이지만 숫자형이라서 측정값(집계적인 데이터)로 인식하기 때문에, 측정값을 변경해줘야한다. 차원과 측정값의 차이를 연령으로 알아보자 행과 열에 [매출액], [Age] 필드를 드래그한다. → Age는 숫자형이기 때문에 측정값 필드로 나뉘고, 합계로 자동 집계됨 → Age를 측정값->차원으로 변경하면 연령대별 매출액으로 시각화된..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/WBAmd/btrHjccYyac/HHJREtuSzCxXKV3eMFg4m0/img.png)
태블로 Tableau 더보기 파일 다운로드 http://github.com/bjpublic/SQL-Tableau GitHub - bjpublic/SQL-Tableau: 데이터 분석과 시각화: SQL로 분석하고 Tableau로 시각화하자 데이터 분석과 시각화: SQL로 분석하고 Tableau로 시각화하자. Contribute to bjpublic/SQL-Tableau development by creating an account on GitHub. github.com 데이터 원본 페이지 구성 왼쪽 패널 : 연결된 데이터 원본 / 시트명(테이블) 캔버스 : 데이터 원본 설정 방법 / 결합 옵션에 대한 정보 데이터 그리드 : 캔버스에서 설정한 데이터가 첫 1,000개 행까지 표시됨 메타데이터 그리드 : 캔버스..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/HNIaU/btrHdIRPxUs/ohxxAhlXi0Vj6nxkwsEnOk/img.png)
* ERD(Entity-Relationship Diagram)는 ERM 프로세스의 최종산출물. * ERM : 데이터를 구조화하기 위한 개체-관계 모델링 기법 * 파일 가져오기 더보기 http://github.com/bjpublic/SQL-Tableau GitHub - bjpublic/SQL-Tableau: 데이터 분석과 시각화: SQL로 분석하고 Tableau로 시각화하자 데이터 분석과 시각화: SQL로 분석하고 Tableau로 시각화하자. Contribute to bjpublic/SQL-Tableau development by creating an account on GitHub. github.com 더보기 - ch.5에서 Car_member.csv / Car_order.csv / Car_orderde..
효율화 & 자동화에 필요한 SQL 문법 VIEW 가상 테이블 또는 저장된 SQL명령어이다. CREATE VIEW [Order_Member] AS SELECT A.* ,B.gender ,B.ageband ,B.join_date FROM [Order] A LEFT JOIN [Member] B ON A.mem_no = B.mem_no A는 전부(*) 셀렉트하고, B에서는 mem_no를 제외한 이유는 [Order]테이블의 mem_no와 중복되는 열이기 때문이다. CREATE VIEW [Order Member] AS SELECT * FROM [Order] A LEFT JOIN [Member] B ON A.mem_no = B.mem_no 반면에 B에서 mem_no를 제외하지 않고 위처럼 입력하면 에러가 난다. SE..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/b1P3G8/btrHaSZ2MxQ/3yPZQ2ALiFXDtJDYjDMTXk/img.png)
윈도우 함수 윈도우 함수는 행과 행간의 관계를 정의하며, 순위 및 집계함수(누적) 2가지 종류가 있다. 1. 윈도우 순위 함수 : 행과 행간의 순위 반환 2. 윈도우 집계 함수 : 행과 행간의 누적 집계 반환 순위함수 : ROW_NUMBER() 동일한 값의 고유한 순위 / RANK() 동일한 값의 고유한 순위(1위,2위..) / DENSE_RANK() 앞의 함수와 흡사하나, 동일한 순위를 하나의 등수로 간주함. 집계함수(누적) : COUNT() / SUM() / AVG() / MAX() / MIN() 윈도우 함수 기본 문법** 더보기 윈도우 함수 + OVER + (ORDER BY 열 ASC OR DECS) 윈도우 함수 + OVER + (PARTITION BY 열 ASC or DECS) *옵션으로 part..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/vX4FS/btrG9lIAtG6/3q3LM5t14qKPB3QaaAkoZk/img.png)
그룹 함수 (WITH ROLLUP, WITH CUBE, GROUPING SETS, GROUPING) WITH ROLLUP : GROUP BY 항목들을 오른쪽에서 왼쪽 순서대로 그룹을 묶는 역할 WITH ROLLUP 사용 안할경우 SELECT YEAR(order_date) AS 연도 ,channel_code AS 채널코드 ,SUM(sales_amt) AS 주문금액 FROM [Order] GROUP BYYEAR(order_date) ,channel_code 마지막 ORDER BY 직전에 WITH ROLL UP추가 SELECT YEAR(order_date) AS 연도 ,channel_code AS 채널코드 ,SUM(sales_amt) AS 주문금액 FROM [Order] GROUP BY YEAR(order_d..
예제 풀어보기 Q01. a. [Order]테이블의 모든 열을 조회하여라. USE EDU SELECT * FROM [Order] b.[shop_code]는 30이상으로만 필터하여라. SELECT * FROM [Order] WHERE shop_code>=30 - SELECT * FROM [TABLE] - 전부다 보는거긴 보는건데, WHERE을 사용해서 조회할 열을 설정 c.[mem_no]별 [sales_amt]합계를 구하여라. (SUM(sales_amt)의 열 이름은 tot_amt) SELECT mem_no ,SUM(sales_amt) AS tot_amt FROM [Order] WHERE shop_code>=30 GROUP - BY mem_no --"~~별로 구하여라" - 해당되는 컬럼만 select해야한다..