Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
Tags
- 마케팅 보다는 취준 강연 같다(?)
- 그룹 연산
- 3기가 마지막이라니..!
- 분석 패널
- 로그 변환
- 데이터 증식
- 리프 중심 트리 분할
- WITH ROLLUP
- DENSE_RANK()
- 그로스 해킹
- tableau
- 컨브넷
- lightgbm
- 부트 스트래핑
- Growth hacking
- ARIMA
- python
- 그로스 마케팅
- splitlines
- pmdarima
- 스태킹 앙상블
- sql
- 데이터 정합성
- 데이터 핸들링
- 캐글 산탄데르 고객 만족 예측
- ImageDateGenerator
- WITH CUBE
- XGBoost
- 캐글 신용카드 사기 검출
- 인프런
Archives
- Today
- Total
목록그룹 연산 (1)
LITTLE BY LITTLE
Pandas - 그룹 연산
데이터를 집계하거나 변환할 때, 한번에 처리하기 위해서 split-apply-combine(분할-반영-결합) 과정을 거쳐야한다. SQL의 GROUP BY 구문과 비슷하다. from google.colab import files myfiles = files.upload() import pandas as pd df = pd.read_csv('gapminder.tsv',sep='\t') avg_life_exp_by_year = df.groupby('year').lifeExp.mean() print(avg_life_exp_by_year) 분할 작업 : 먼저 데이터를 중복 없이 추출 years = df.year.unique() print(years) 반영 작업 : loc을 이용, 1952년의 데이터를 추출 y19..
데이터 분석/파이썬 Basic & EDA
2022. 7. 12. 09:22