| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | ||||||
| 2 | 3 | 4 | 5 | 6 | 7 | 8 |
| 9 | 10 | 11 | 12 | 13 | 14 | 15 |
| 16 | 17 | 18 | 19 | 20 | 21 | 22 |
| 23 | 24 | 25 | 26 | 27 | 28 | 29 |
| 30 |
- pmdarima
- WITH CUBE
- 부트 스트래핑
- 그룹 연산
- 분석 패널
- splitlines
- ARIMA
- 데이터 핸들링
- 데이터 증식
- 스태킹 앙상블
- 컨브넷
- ImageDateGenerator
- 3기가 마지막이라니..!
- python
- 마케팅 보다는 취준 강연 같다(?)
- 인프런
- Growth hacking
- tableau
- 캐글 신용카드 사기 검출
- DENSE_RANK()
- 데이터 정합성
- 리프 중심 트리 분할
- WITH ROLLUP
- sql
- 그로스 해킹
- XGBoost
- lightgbm
- 그로스 마케팅
- 캐글 산탄데르 고객 만족 예측
- 로그 변환
- Today
- Total
목록전체 글 (193)
LITTLE BY LITTLE
시계열 추세를 반영한 군집 분석 - DTW(Dynamic Time Warping)을 활용 - 계층적 군집 분석과의 융합 고려 데이터들의 성격을 파악할 수 있는 비지도 학습을 통해서 유용한 특성 구조를 발견할 수 있다. 대표적인 비지도 학습 방법인 군집 분석 데이터들이 얼마나 퍼져있는지, 모여있는지(분산)를 눈으로 파악하지 못할 때 유용 사용자가 직접 모델을 해석해야 하며, 이 때 생성되는 규칙을 추론하여 데이터를 해석해야 함 많이 알려진 K-means는 비계층적 군집화(=구하고자 하는 군집의 수를 정한 상태에서 설정된 군집의 중심에 가장 가까운 개체를 하나씩 포함해 가는 군집 형성 방법) 공부 안해봤던 계층적 군집화를 중점으로 알아보자. 비계층적 군집화 https://noelee.tistory.com/1..
date와 timestamp 복습 https://noelee.tistory.com/180 [3] 데이터 분석 SQL 실습 - Between 조인, Cross 조인, Date와 Timestamp, ::Date, Interval 활용 오늘의 실습 내용 요약 1. BETWEEN 조인 2. CROSS 조인 3. 문자열을 Date, Timestamp로 변환하기 4. ::로 편리하게 형태 변환하기 5. Timestamp 연산 시 Interval 활용하기 Non Equi 조인과 Cross 조인 Equi 조인 : 조인 noelee.tistory.com date_trunc 함수를 이용하여 년/월/일/시간/분/초 단위 절삭하기 select trunc(99.9999, 2); >> 99.99 --date_trunc는 인자로 ..
https://school.programmers.co.kr/learn/courses/30/lessons/12981 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr HTML 삽입 미리보기할 수 없는 소스
※ Review 더보기 1. 시계열 분석 모델 [단변량], hyper parameter p,d,q 2. 정상성의 개념, 정상성 검증 방법 ADF, KPSS Test *ADF, KPSS Test = 단위근 테스트= 차분이 필요한지 객관적으로 결정하는 일반적인 방법 [3] 직관적인 정상성 검정 방법 ACF/PACF Plot, 차분 단순히 시계열 그래프만 보고나서 p,q값이 데이터에 맞았는지 이야기하기는 어렵다. 따라서 필수는 아니지만, ACF, PACF Plot을 참고할 필요성이 있다. 1. ACF (AucoCorrelation Function)와 PACF(Particlal ACF) 의 개념 : 현재의 값이 과거의 값과 어떤 관계를 갖고 있는지 보여주는 Plot ACF : 자기상관함수로, k시간 단위로 구분..
0. 시계열 데이터 : 연속 시계열 데이터는 모든 시점이 연결되어 있기 때문에 분석하기 부담스러워 이산 시계열 데이터를 많이 사용한다. 특정 시점에서 측정한 관측값들의 집합 1. 정상성을 나타내는 시계열 확인하기 1-1. 정상성을 나타내지 않는 시계열 : 추세가 있고 수준이 변하는 경우 & 계절성이 보이는 경우 & 평균과 분산이 일정하지 않은 경우 (a),(c),(e),(f),(i) - 추세가 있고 수준이 변하는 경우 (d).(h) - 분명하게 계절성이 보이는 경우 (i) - 분산이 증가하는 경우 1-2. 정상성을 나타내는 시계열 : 규칙적인 주기나 추세, 계절성이 없고 평균과 분산이 일정한 경우 (b),(g) 정상성을 나타내는 시계열 ※ 헷갈릴 수 있는 경우 : (g)는 뚜렷한 주기가 나타나긴 하지만,..
ARIMA는 AR 모형(Auto Regressive) 부분도 있고, MA(Moving Average) 부분도 있음 1-1. AR(Autoregressive) models : 자기 자신을 종속변수로하고, 이전 시점의 시계열(lag)을 독립변수로 갖는 모델 * hyper parameter: P 과거의 값이 현재의 값에 영향을 줄 때 사용 AP(p)는 차수가 p인 자기 회귀 모형 AR1. 백색잡음: 과거의 값으로 현재의 값을 예측할 수 없는 랜덤한 상태 AR2. 확률 보행: 현재 값을 예측할 수 있는 가장 좋은 값은 어제의 값 [ yt=yt−1+ϵt ] AR3. 표류가 있는 확률 보행: 시간이 지남에 따라 평균적으로 값이 증가/감소[ yt=c+yt−1+ϵt ] AR4. 정상성을 만족하는 모형 => AR4를 제..
테이블1. 시각적 개체 - 스타일 사전 설정 - "대체 행"2. 시각적 개체 - 눈금 - 옵션 - "행 안쪽 여백과 전역 글꼴 크기" 늘림3. 시각적 개체 - 열 머리글 - 머리글 맞춤 - "가운데 맞춤"행렬1. 드릴온을 '행'으로 놓고, 파란색으로 표시한 아이콘(계층 구조에서 한 수준 아래로 모두 확장)을 누르면 확장된 상태로 표시 된다. -> 시각적 개체 - 텍스트 - 옵션 - 계단형 레이아웃 - "계단형 레이아웃 들여쓰기" 늘리기2. 계단형 레이아웃을 해제하면 행 머리글이 분리해서 표시 된다** 참고: 데이터를 선택해서 해당 데이터에 해당하는 부분만 강조되었을 때, 해당 데이터를 한 번 더 누르면 해제 됨 3. 드릴온을 '열'로 두고 확장했을 때, 열에 해당하는 분기가 연도로 확장되어 표시 됨상호 ..
2강 순서1. Business Intelligence 정의2. Self Service 정의 및 시장3. Self Service Tool, MS Power BI 4. Power BI Service 구성 요소 및 버전1. Business Intelligence 정의BI 분류전략 인텔리전스분석 인텔리전스: 이슈 해결 및 의사결정을 위한 보고서 생성 & 조회 & 정보 생성확장 인텔리전스: 기업 내부 및 외부 이해관계자 상호 프로세스상 생성 되는 데이터 분석 & 정보 제공인텔리전스 인프라: 구현을 위한 기술 및 데이터 제공인텔리전스 정보전달: 생성된 정보를 사용자의 요구에 맞게 제공Self Service BI 정의 : 전문 지식이 없는 사람들도 본인 분야에 대한 데이터를 직접 분석한다는 의미 Self Servic..