Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- pmdarima
- python
- sql
- 컨브넷
- 데이터 핸들링
- 리프 중심 트리 분할
- 그로스 마케팅
- WITH ROLLUP
- Growth hacking
- 데이터 증식
- splitlines
- DENSE_RANK()
- lightgbm
- 캐글 신용카드 사기 검출
- 분석 패널
- 마케팅 보다는 취준 강연 같다(?)
- 3기가 마지막이라니..!
- 부트 스트래핑
- ARIMA
- 인프런
- 그룹 연산
- 캐글 산탄데르 고객 만족 예측
- 스태킹 앙상블
- XGBoost
- tableau
- ImageDateGenerator
- 데이터 정합성
- 그로스 해킹
- 로그 변환
- WITH CUBE
Archives
- Today
- Total
목록그룹 연산 (1)
LITTLE BY LITTLE
Pandas - 그룹 연산
데이터를 집계하거나 변환할 때, 한번에 처리하기 위해서 split-apply-combine(분할-반영-결합) 과정을 거쳐야한다. SQL의 GROUP BY 구문과 비슷하다. from google.colab import files myfiles = files.upload() import pandas as pd df = pd.read_csv('gapminder.tsv',sep='\t') avg_life_exp_by_year = df.groupby('year').lifeExp.mean() print(avg_life_exp_by_year) 분할 작업 : 먼저 데이터를 중복 없이 추출 years = df.year.unique() print(years) 반영 작업 : loc을 이용, 1952년의 데이터를 추출 y19..
데이터 분석/파이썬 Basic & EDA
2022. 7. 12. 09:22