일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- WITH ROLLUP
- python
- ImageDateGenerator
- 데이터 증식
- 리프 중심 트리 분할
- 로그 변환
- pmdarima
- 분석 패널
- sql
- 캐글 신용카드 사기 검출
- 캐글 산탄데르 고객 만족 예측
- 마케팅 보다는 취준 강연 같다(?)
- 그룹 연산
- tableau
- 스태킹 앙상블
- 3기가 마지막이라니..!
- splitlines
- DENSE_RANK()
- 부트 스트래핑
- lightgbm
- 데이터 정합성
- Growth hacking
- ARIMA
- WITH CUBE
- 그로스 해킹
- 인프런
- 컨브넷
- 데이터 핸들링
- 그로스 마케팅
- XGBoost
- Today
- Total
목록4-2/Hands On Data Aanalysis With Pandas (4)
LITTLE BY LITTLE
**Contents** Matplotlib 1. Histogram (default) 2. Plot components fig.add_axes() plt.subplots() fig.add_gridspec (사이즈가 다른 subplots 생성) 3. Save plots ( plt.savefig() ), Cleaning up ( plt.close() ) 4. Additional plotting options rcParams[ ] rcparams_list = list(mpl.rcParams.keys()) mpl.rcParams['figure.figsize'] = (300,10) figsize 업데이트 가능 plt.rc('figure', firsize= (20,20)) rcdefault()로 default 복구 ..
ch_04 0. weather_data_collection 1. querying and merging query() merge dataframes 머지 하기 전에 unique values 개수 확인 shape[0]으로 열의 개수 동일한지 확인 - 함수 정의 get_row_count parameters left_on, right_on on( 머지 대상 컬럼이 동일할 경우 중복된 데이터가 없도록 해줌) how= 'right', 'left', 'outer' ... left_index, right_index => 합치는 대상 컬럼의 '인덱스'가 동일할 경우, 둘다 True로 specify 해줘야함 위처럼 동일한 인덱스를 합쳤을 경우, suffixes에 리스트로 지정해주기 2. dataframe_operation..
Ch_02 Basic Structure Pandas_Data_Structure DataFrame_Operations max([row[3] for row in data]) 넘파이 배열 numpy array 에서 => dictionary로 변환 : { col : np.array(row[i] for row in data]) for i, col in enumerate(data.dtypes.names)} np.linspace(start,stop,num=)로 넘파이 배열 생성 넘파이 배열 numpy array 에서 => dataframe로 변환 : pd.DataFrame(array_dict) 시리즈 생성 => pd.Series(딕셔너리['컬럼 이름'], name=이름지정) pd.Series(numbers, inde..
ch_03. wide_vs_long wide가 일반적으로 많이 본 형태, describe로 한 눈에 볼때 편리, pandas의 matplotlib로 시각화 long은 컬럼명이 data type과 value로 구성, describe하기에 적절치 않음, seaborn으로 시각화 using_the_weather_api cleaning_data df.rename(str.supper(axis='columns').columns pd.to_datetime(df.col) pd.tz_localize(), pd.tz_convert(), pd.tz_localize(None).to_period('M').to_timestamp().index assign()으로 한번에 데이터 타입 변경 (df.col.astype('int' or..