일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 부트 스트래핑
- 3기가 마지막이라니..!
- lightgbm
- sql
- tableau
- 데이터 핸들링
- WITH CUBE
- 데이터 증식
- 캐글 산탄데르 고객 만족 예측
- ImageDateGenerator
- 데이터 정합성
- 그로스 해킹
- 그룹 연산
- splitlines
- 분석 패널
- 마케팅 보다는 취준 강연 같다(?)
- 컨브넷
- ARIMA
- 스태킹 앙상블
- WITH ROLLUP
- 로그 변환
- XGBoost
- 리프 중심 트리 분할
- DENSE_RANK()
- pmdarima
- Growth hacking
- python
- 인프런
- 캐글 신용카드 사기 검출
- 그로스 마케팅
- Today
- Total
목록데이터 분석 (55)
LITTLE BY LITTLE
목차 Part 5. 대안적 실험 설계 11.1 불응 11.2 잠재적 결과 확장 11.3 도구변수 식별 가정 11.4 1단계 11.5 2단계 11.6 2단계 최소제곱법 11.7 표준오차 11.8 통제변수와 도구변수 추가 11.8.1 2SLS 직접 구현 11.8.2 행렬 구현 11.9 불연속 설계 11.9.1 불연속 설계 가정 11.9.2 처치 의도 효과 11.9.3 도구변수 추정값 11.9.4 밀도 불연속 테스트 11.10 요약11장. 불응과 도구변수서비스의 영향을 추론하기 어려운 이유는, 서비스를 고객이 '선택'하는 경우가 많기 때문이다.참여 여부는 고객의 선택에 달려있음제공 여부를 무작위로 결정하더라도, 고객에게 이를 받아들이도록 강요할 수는 없다.이를 '불응'이라 하며, 처치를 배정받은 모든 사람이 ..
목차 Part 5. 대안적 실험 설계 10.1 지역 실험 10.2 통제집단합성법 설계 10.2.1 무작위로 실험군 선택하기 10.2.2 무작위 탐색 10.3 스위치백 실험 10.3.1 시퀀스의 잠재적 결과 10.3.2 이월 효과의 차수 추정 10.3.3 디자인 기반의 추정 10.3.4 최적의 스위치백 설계 10.3.5 강건한 분산 10.4 요약 마케팅 효과를 추론하는 것이 어려운 이유 중 하나는 사람들을 무작위로 배정할 수 없기 때문이다. 한 가지 좋은 대안은 도시나 주와 같은 전체 대상을 실험군으로 하고, 다른 시장은 대조군으로 남겨두는 지역 실험을 수행하는 것 4부에서 배운 기법을 적용할 수 있는 패널데이터를 바탕으로 하며, 다루지 않았던 최적의 실험군과 대조군의 선정에 대해 배운다. 만약 전체 시장..
목차 9.1 온라인 마케팅 데이터셋 9.2 행렬 표현 9.3 통제집단합성법과 수평 회귀분석 9.4 표준 통제집단합성법 9.5 통제집단합성법과 공변량 9.6 통제집단합성법과 편향 제거 9.7 추론 9.8 합성 이중차분법9.8.1 이중차분법 복습 9.8.2 통제집단합성법 복습 9.8.3 시간 가중치 추정하기 9.8.4 통제집단합성법과 이중차분법9.9 요약9.5 통제집단합성법과 공변량일반적으로 우리는 대조군의 처치 전 결과를 특성으로 Ytr 을 예측한다.드물긴 하지만, 만약 예측력이 좋다고 생각되는 공변량이 있다면, 포함시킬 수 있다. 시장 규모에 따라 정규화한 경쟁사의 일별 다운로드 수 데이터(comp_download_pct)를 공변량으로 모델에 포함시켜보자. 가중치 wi가 yco 뿐만 아니라, 추가 공변량..
목차 9.1 온라인 마케팅 데이터셋 9.2 행렬 표현 9.3 통제집단합성법과 수평 회귀분석 9.4 표준 통제집단합성법 9.5 통제집단합성법과 공변량 9.6 통제집단합성법과 편향 제거 9.7 추론 9.8 합성 이중차분법9.8.1 이중차분법 복습 9.8.2 통제집단합성법 복습 9.8.3 시간 가중치 추정하기 9.8.4 통제집단합성법과 이중차분법9.9 요약9장. 통제집단합성법통제 집단합성법 : 대조군을 결합해서 처치가 없을 때의 실험군과 비슷한 가상의 대조군을 만드는 것 패널데이터는, 과거 자신과 비교할 수 있다는 점이 보다 타당한 가정 하에서 반사실의 추정을 가능하게 했다. 그리고 패널데이터셋에 널리 사용되는 이중차분법은, 실험군과 대조군의 평행 추세를 가정함으로써 처치효과를 식별할 수 있었다. 그러나, 이..
목차8.1 패널데이터 8.2 표준 이중차분법 8.2.1 이중차분법과 결과 변화 8.2.2 이중차분법과 OLS 8.2.3 이중차분법과 고정효과 8.2.4 이중차분법과 블록 디자인 8.2.5 추론 8.3 식별 가정 8.3.1 평행 추세 8.3.2 비기대 가정과 SUTVA 8.3.3 강외생성 8.3.4 시간에 따라 변하지 않는 교란 요인 8.3.5 피드백 없음 8.3.6 이월 효과와 시차종속변수 없음8.4 시간에 따른 효과 변동 8.5 이중차분법과 공변량 8.6 이중 강건 이중차분법8.6.1 성향점수 모델 8.6.2 델타 결과 모델 8.6.3 최종 결과8.7 처치의 시차 도입8.7.1 시간에 따른 이질적 효과 8.7.2 공변량8.8 요약8장. 이중차분법 8.4 시간에 따른 변동 지금까지 살펴본 표준 이중차분법..
목차8.1 패널데이터 8.2 표준 이중차분법8.2.1 이중차분법과 결과 변화 8.2.2 이중차분법과 OLS 8.2.3 이중차분법과 고정효과 8.2.4 이중차분법과 블록 디자인 8.2.5 추론8.3 식별 가정8.3.1 평행 추세 8.3.2 비기대 가정과 SUTVA 8.3.3 강외생성 8.3.4 시간에 따라 변하지 않는 교란 요인 8.3.5 피드백 없음 8.3.6 이월 효과와 시차종속변수 없음 8.4 시간에 따른 효과 변동 8.5 이중차분법과 공변량 8.6 이중 강건 이중차분법 8.6.1 성향점수 모델 8.6.2 델타 결과 모델 8.6.3 최종 결과 8.7 처치의 시차 도입 8.7.1 시간에 따른 이질적 효과 8.7.2 공변량 8.8 요약8장. 이중차분법 다시 ATE 추정으로 돌아가서, 인과추론에 패널데이터..
목차7.1 이산형 처치 메타러너 7.1.1 T 러너 7.1.2 X 러너 7.2 연속형 처치 메타러너 7.2.1 S 러너 7.2.2 이중/편향 제거 머신러닝 7.3 요약7장. 메타러너 위의 그림의 메타몽이 피카츄, 파이리, 이상해씨가 되듯이 메타 러너의 "meta"는 CATE를 추정하기 위한 base 알고리즘이 랜덤포레스트나 BART (Bayesian Additive Regression Tree)처럼 여러 형태를 가질 수 있음을 의미한다. 이질적 처치효과를 식별하기 위해 CATE를 추정했었다. (도함수의 정의 활용)이는 모든 대상에게 처치할 수 없고, 우선순위를 정해야 하는 경우에 매우 유용하다.이번 장에서는 몇 가지 머신러닝 알고리즘을 섞어 CATE 추정을 해보자.머신러닝 알고리즘은 고차원 데이터를 잘 ..
목차6.1 ATE에서 CATE로 6.2 예측이 답이 아닌 이유 6.3 회귀분석으로 CATE 구하기 6.4 CATE 예측 평가하기 6.5 모델 분위수에 따른 효과 6.6 누적 효과 곡선 6.7 누적 이득 곡선 6.8 목표 변환 6.9 예측 모델이 효과 정렬에 좋을 때6.9.1 한계 수확 체감 6.9.2 이진 결과6.10 의사결정을 위한 CATE 6.11 요약6장. 이질척 처치효과 이전까지는 처치의 평균적인 영향을 살펴보았다면, 이번 장에서는 처치가 사람마다 어떻게 다른 영향을 미치는지에 초점을 맞출 것처치 효과는 일정하지 않기에, 어떤 대상이 처치에 더 잘 반응하는지 아는 것은 처치 대상을 결정하는 데 중요한 역할을 한다.즉, 이질적 효과는 "개인화"라는 개념에 대해 인과추론으로 접근할 수 있는 길을 열어..