Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 캐글 신용카드 사기 검출
- WITH CUBE
- ImageDateGenerator
- 리프 중심 트리 분할
- Growth hacking
- python
- 컨브넷
- 그로스 마케팅
- 데이터 핸들링
- WITH ROLLUP
- 분석 패널
- 데이터 증식
- sql
- tableau
- pmdarima
- 로그 변환
- 인프런
- 그로스 해킹
- 마케팅 보다는 취준 강연 같다(?)
- DENSE_RANK()
- 3기가 마지막이라니..!
- lightgbm
- XGBoost
- ARIMA
- 캐글 산탄데르 고객 만족 예측
- 스태킹 앙상블
- 그룹 연산
- 부트 스트래핑
- splitlines
- 데이터 정합성
Archives
- Today
- Total
목록그룹 연산 (1)
LITTLE BY LITTLE
Pandas - 그룹 연산
데이터를 집계하거나 변환할 때, 한번에 처리하기 위해서 split-apply-combine(분할-반영-결합) 과정을 거쳐야한다. SQL의 GROUP BY 구문과 비슷하다. from google.colab import files myfiles = files.upload() import pandas as pd df = pd.read_csv('gapminder.tsv',sep='\t') avg_life_exp_by_year = df.groupby('year').lifeExp.mean() print(avg_life_exp_by_year) 분할 작업 : 먼저 데이터를 중복 없이 추출 years = df.year.unique() print(years) 반영 작업 : loc을 이용, 1952년의 데이터를 추출 y19..
데이터 분석/파이썬 Basic & EDA
2022. 7. 12. 09:22