일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- pmdarima
- 컨브넷
- XGBoost
- WITH ROLLUP
- 3기가 마지막이라니..!
- ImageDateGenerator
- 부트 스트래핑
- 데이터 핸들링
- WITH CUBE
- 스태킹 앙상블
- lightgbm
- 로그 변환
- ARIMA
- Growth hacking
- 데이터 증식
- splitlines
- 인프런
- 그룹 연산
- python
- 캐글 신용카드 사기 검출
- 데이터 정합성
- 리프 중심 트리 분할
- sql
- tableau
- 그로스 마케팅
- 그로스 해킹
- 분석 패널
- 마케팅 보다는 취준 강연 같다(?)
- DENSE_RANK()
- 캐글 산탄데르 고객 만족 예측
- Today
- Total
목록분류 전체보기 (192)
LITTLE BY LITTLE
date와 timestamp 복습 https://noelee.tistory.com/180 [3] 데이터 분석 SQL 실습 - Between 조인, Cross 조인, Date와 Timestamp, ::Date, Interval 활용 오늘의 실습 내용 요약 1. BETWEEN 조인 2. CROSS 조인 3. 문자열을 Date, Timestamp로 변환하기 4. ::로 편리하게 형태 변환하기 5. Timestamp 연산 시 Interval 활용하기 Non Equi 조인과 Cross 조인 Equi 조인 : 조인 noelee.tistory.com date_trunc 함수를 이용하여 년/월/일/시간/분/초 단위 절삭하기 select trunc(99.9999, 2); >> 99.99 --date_trunc는 인자로 ..
https://school.programmers.co.kr/learn/courses/30/lessons/12981 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr HTML 삽입 미리보기할 수 없는 소스
※ Review 더보기 1. 시계열 분석 모델 [단변량], hyper parameter p,d,q 2. 정상성의 개념, 정상성 검증 방법 ADF, KPSS Test *ADF, KPSS Test = 단위근 테스트= 차분이 필요한지 객관적으로 결정하는 일반적인 방법 [3] 직관적인 정상성 검정 방법 ACF/PACF Plot, 차분 단순히 시계열 그래프만 보고나서 p,q값이 데이터에 맞았는지 이야기하기는 어렵다. 따라서 필수는 아니지만, ACF, PACF Plot을 참고할 필요성이 있다. 1. ACF (AucoCorrelation Function)와 PACF(Particlal ACF) 의 개념 : 현재의 값이 과거의 값과 어떤 관계를 갖고 있는지 보여주는 Plot ACF : 자기상관함수로, k시간 단위로 구분..
0. 시계열 데이터 : 연속 시계열 데이터는 모든 시점이 연결되어 있기 때문에 분석하기 부담스러워 이산 시계열 데이터를 많이 사용한다. 특정 시점에서 측정한 관측값들의 집합 1. 정상성을 나타내는 시계열 확인하기 1-1. 정상성을 나타내지 않는 시계열 : 추세가 있고 수준이 변하는 경우 & 계절성이 보이는 경우 & 평균과 분산이 일정하지 않은 경우 (a),(c),(e),(f),(i) - 추세가 있고 수준이 변하는 경우 (d).(h) - 분명하게 계절성이 보이는 경우 (i) - 분산이 증가하는 경우 1-2. 정상성을 나타내는 시계열 : 규칙적인 주기나 추세, 계절성이 없고 평균과 분산이 일정한 경우 (b),(g) 정상성을 나타내는 시계열 ※ 헷갈릴 수 있는 경우 : (g)는 뚜렷한 주기가 나타나긴 하지만,..
ARIMA는 AR 모형(Auto Regressive) 부분도 있고, MA(Moving Average) 부분도 있음 1-1. AR(Autoregressive) models : 자기 자신을 종속변수로하고, 이전 시점의 시계열(lag)을 독립변수로 갖는 모델 * hyper parameter: P 과거의 값이 현재의 값에 영향을 줄 때 사용 AP(p)는 차수가 p인 자기 회귀 모형 AR1. 백색잡음: 과거의 값으로 현재의 값을 예측할 수 없는 랜덤한 상태 AR2. 확률 보행: 현재 값을 예측할 수 있는 가장 좋은 값은 어제의 값 [ yt=yt−1+ϵt ] AR3. 표류가 있는 확률 보행: 시간이 지남에 따라 평균적으로 값이 증가/감소[ yt=c+yt−1+ϵt ] AR4. 정상성을 만족하는 모형 => AR4를 제..
테이블1. 시각적 개체 - 스타일 사전 설정 - "대체 행"2. 시각적 개체 - 눈금 - 옵션 - "행 안쪽 여백과 전역 글꼴 크기" 늘림3. 시각적 개체 - 열 머리글 - 머리글 맞춤 - "가운데 맞춤"행렬1. 드릴온을 '행'으로 놓고, 파란색으로 표시한 아이콘(계층 구조에서 한 수준 아래로 모두 확장)을 누르면 확장된 상태로 표시 된다. -> 시각적 개체 - 텍스트 - 옵션 - 계단형 레이아웃 - "계단형 레이아웃 들여쓰기" 늘리기2. 계단형 레이아웃을 해제하면 행 머리글이 분리해서 표시 된다** 참고: 데이터를 선택해서 해당 데이터에 해당하는 부분만 강조되었을 때, 해당 데이터를 한 번 더 누르면 해제 됨 3. 드릴온을 '열'로 두고 확장했을 때, 열에 해당하는 분기가 연도로 확장되어 표시 됨상호 ..
2강 순서1. Business Intelligence 정의2. Self Service 정의 및 시장3. Self Service Tool, MS Power BI 4. Power BI Service 구성 요소 및 버전1. Business Intelligence 정의BI 분류전략 인텔리전스분석 인텔리전스: 이슈 해결 및 의사결정을 위한 보고서 생성 & 조회 & 정보 생성확장 인텔리전스: 기업 내부 및 외부 이해관계자 상호 프로세스상 생성 되는 데이터 분석 & 정보 제공인텔리전스 인프라: 구현을 위한 기술 및 데이터 제공인텔리전스 정보전달: 생성된 정보를 사용자의 요구에 맞게 제공Self Service BI 정의 : 전문 지식이 없는 사람들도 본인 분야에 대한 데이터를 직접 분석한다는 의미 Self Servic..
순서 1. 데이터 가져오기 및 정리 2. 보고서 시각화 하기 3. 반응형 보고서 만들기 (슬라이서, 필터) 4. POWER BI Service와 Mobile로 게시 시나리오 영업팀에서 지난 3년간 매출 자료를 기반으로 1. 매출 트렌드, 2. 카테고리 별 매출 현황, 3. 리셀러 별 매출 현황을 보고서로 작성해야 하는 상황 1. 데이터 가져오기 및 정리 데이터 종류 총 28개 DB 엔진 ( SQL, ORACLE, Spark ... ) ***데이터 사전 작업 파워 쿼리 편집기 사용 1. 머리글 컬럼 적용 2. 자료형 체크 및 수정 데이터 모델 편집기 사용 : 데이터간 관계 살피기 2. 보고서 시각화하기 2-1. 매출 트렌드 - 꺾은선형 차트 시각화 = 시계열 분석 2-2. 카테고리 별 매출 현황 - 막대 ..