일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- DENSE_RANK()
- 그로스 마케팅
- pmdarima
- Growth hacking
- 리프 중심 트리 분할
- 데이터 핸들링
- ImageDateGenerator
- python
- WITH CUBE
- 3기가 마지막이라니..!
- ARIMA
- 그룹 연산
- sql
- 분석 패널
- 스태킹 앙상블
- XGBoost
- 캐글 신용카드 사기 검출
- 데이터 증식
- 그로스 해킹
- 컨브넷
- 부트 스트래핑
- 마케팅 보다는 취준 강연 같다(?)
- WITH ROLLUP
- splitlines
- 데이터 정합성
- 로그 변환
- tableau
- lightgbm
- 캐글 산탄데르 고객 만족 예측
- 인프런
- Today
- Total
목록분류 전체보기 (192)
LITTLE BY LITTLE
목차 3. 데이터 가공을 위한 SQL 3-1. 하나의 값 조작하기 (5강) 3-2. 여러 개의 값에 대한 조작 (6강) 3-3. 하나의 테이블에 대한 조작 (7강) 3-4. 여러 개의 테이블 조작하기 (8강) 4. 매출을 파악하기 위한 데이터 추출 4-1. 시계열 기반으로 데이터 집계하기 4-2. 다면적인 축을 사용해 데이터 집약하기 5. 사용자를 파악하기 위한 데이터 추출 5-1. 사용자 전체의 특징과 경향 찾기 5-2. 시계열에 따른 사용자 전체의 상태 변화 찾기 5-3. 시계열에 따른 사용자의 개별적인 행동 분석하기 6. 웹사이트에서 행동을 파악하는 데이터 추출하기 6-1. 사이트 전체의 특징/경향 찾기 6-2. 사이트 내의 사용자 행동 파악하기 6-3. 입력 양식 최적화하기 7. 데이터 활용의 정..
Q1. emp 테이블 내 사원 이름, 직업, 월급을 출력하고, 직업 별 사원들의 월급 합계를 높은 순으로 보여주시오.select ename, job, sal, sum(sal) over(partition by job order by sal desc range between unbounded preceding and unbounded following) as "직업별 합계" from emp; select ename, job, sal, sum(sal) over(partition by job order by sal desc range between unbounded preceding and current row) as "직업별 합계" from emp; → unbounded following이었을 때에는, cle..
목차 3. 데이터 가공을 위한 SQL 3-1. 하나의 값 조작하기 (5강) 3-2. 여러 개의 값에 대한 조작 (6강) 3-3. 하나의 테이블에 대한 조작 (7강) 4. 매출을 파악하기 위한 데이터 추출 4-1. 시계열 기반으로 데이터 집계하기 4-2. 다면적인 축을 사용해 데이터 집약하기 5. 사용자를 파악하기 위한 데이터 추출 5-1. 사용자 전체의 특징과 경향 찾기 5-2. 시계열에 따른 사용자 전체의 상태 변화 찾기 5-3. 시계열에 따른 사용자의 개별적인 행동 분석하기 6. 웹사이트에서 행동을 파악하는 데이터 추출하기 6-1. 사이트 전체의 특징/경향 찾기 6-2. 사이트 내의 사용자 행동 파악하기 6-3. 입력 양식 최적화하기 7. 데이터 활용의 정밀도를 높이는 분석 기술 7-1. 데이터를 조..
목차 3. 데이터 가공을 위한 SQL 3-1. 하나의 값 조작하기 (5강) 3-2. 여러 개의 값에 대한 조작 (6강) 3-3. 하나의 테이블에 대한 조작 (7강) 4. 매출을 파악하기 위한 데이터 추출 4-1. 시계열 기반으로 데이터 집계하기 4-2. 다면적인 축을 사용해 데이터 집약하기 5. 사용자를 파악하기 위한 데이터 추출 5-1. 사용자 전체의 특징과 경향 찾기 5-2. 시계열에 따른 사용자 전체의 상태 변화 찾기 5-3. 시계열에 따른 사용자의 개별적인 행동 분석하기 6. 웹사이트에서 행동을 파악하는 데이터 추출하기 6-1. 사이트 전체의 특징/경향 찾기 6-2. 사이트 내의 사용자 행동 파악하기 6-3. 입력 양식 최적화하기 7. 데이터 활용의 정밀도를 높이는 분석 기술 7-1. 데이터를 조..
목차 3. 데이터 가공을 위한 SQL 3-1. 하나의 값 조작하기 (5강) 3-2. 여러 개의 값에 대한 조작 (6강) 3-3. 하나의 테이블에 대한 조작 (7강) 4. 매출을 파악하기 위한 데이터 추출 4-1. 시계열 기반으로 데이터 집계하기 4-2. 다면적인 축을 사용해 데이터 집약하기 5. 사용자를 파악하기 위한 데이터 추출 5-1. 사용자 전체의 특징과 경향 찾기 5-2. 시계열에 따른 사용자 전체의 상태 변화 찾기 5-3. 시계열에 따른 사용자의 개별적인 행동 분석하기 6. 웹사이트에서 행동을 파악하는 데이터 추출하기 6-1. 사이트 전체의 특징/경향 찾기 6-2. 사이트 내의 사용자 행동 파악하기 6-3. 입력 양식 최적화하기 7. 데이터 활용의 정밀도를 높이는 분석 기술 7-1. 데이터를 조..
Steps¶1. 시계열 시각화 - 추세, 계절성, 주기 파악¶1-1. 추세: 추세가 있다면 차분이 필요, 차분 횟수를 알 수 있는 단위근 검정 실시 (pmdarima.arima의 ndiffs 함수로 구할 수 있음)1-2. 계절성: 계절성이 있다면, seasonal=True로 지정해주어 SARIMA로1-3. 주기: 주기가 있다면, auto_arima 함수의 m의 인자에 넣어주기m=7 - daily m=52 - weekly (1년=52주) m=12 - monthly m=1 - 비계졀성 (default)2. 모형 적합 - 적절한 p,d,q를 auto_arima로 추정¶3. 잔차 검정 - 잔차가 정상성을 만족하느지 ,정규성 및 등분산성을 만족하는지 파악¶4. 모형 refresh & 예측¶한번에 테스트 데이터를 ..
※ Review 더보기 1. 시계열 분석 모델 [단변량], hyper parameter p,d,q 2. 정상성의 개념, 정상성 검증 방법 ADF, KPSS Test *ADF, KPSS Test = 단위근 테스트= 차분이 필요한지 객관적으로 결정하는 일반적인 방법 3. 직관적인 정상성 검증 방법 - ACF, PACF Plot *ACF, PACF Plot = (부분)자기상관함수 = AR과 MA의 사용 여부 & p,q값을 정하는 데 도움 시계열 모델 정리 정상성을 갖는 시계열에 적합한 모형 - AR, MA, ARMA 모형 AR모형 : 이름처럼, 자기상관성을 시계열 모형으로 구성 - 과거 관측값들의 선형결합으로 해당 변수의 미래 값을 예측하는 모델 - 이전 자신의 관측값이 이후 자기 관측값에 영향을 준다는 아이..
시계열 추세를 반영한 군집 분석 - DTW(Dynamic Time Warping)을 활용 - 계층적 군집 분석과의 융합 고려 데이터들의 성격을 파악할 수 있는 비지도 학습을 통해서 유용한 특성 구조를 발견할 수 있다. 대표적인 비지도 학습 방법인 군집 분석 데이터들이 얼마나 퍼져있는지, 모여있는지(분산)를 눈으로 파악하지 못할 때 유용 사용자가 직접 모델을 해석해야 하며, 이 때 생성되는 규칙을 추론하여 데이터를 해석해야 함 많이 알려진 K-means는 비계층적 군집화(=구하고자 하는 군집의 수를 정한 상태에서 설정된 군집의 중심에 가장 가까운 개체를 하나씩 포함해 가는 군집 형성 방법) 공부 안해봤던 계층적 군집화를 중점으로 알아보자. 비계층적 군집화 https://noelee.tistory.com/1..