'데이터 분석/파이썬 Basic & EDA' 카테고리의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록데이터 분석/파이썬 Basic & EDA (5)

LITTLE BY LITTLE

[1] 전처리&EDA 연습 - 캐글 Mall Customer Segmentation Data

https://www.kaggle.com/datasets/vjchoudhary7/customer-segmentation-tutorial-in-python Mall Customer Segmentation Data Market Basket Analysis www.kaggle.com Customer ID, age, gender, annual income, spending score과 같은 기본 정보만 있음 여기서 spending score은 customer behavior, purchasing data등에 기반해 매긴 점수 분석의 최종 목표는 "k-means clustering"기법으로 고객들을 segmentation 하는 것 참고 https://www.kaggle.com/code/gadigevishalsai..

데이터 분석/파이썬 Basic & EDA 2022. 9. 12. 12:32

시계열 데이터 Datetime / parse_dates / DatetimeIndex / Shift

datetime 오브젝트 from datetime import datetime now1=datetime.now() print(now1) now2=datetime.today() print(now2) t1 = datetime.now() t2 = datetime(1970,1,1) t3 = datetime(1970, 12, 12, 13, 24, 34) diff1 = t1 - t2 print(diff1) print(type(diff1)) #datetime pd.to_datetime 시계열 데이터는 문자열인데, 문자열은 시간 계산을 할 수 없기 때문에 datetime 오브젝트로 변환해주어야한다. import pandas as pd import os from google.colab import files myfile..

데이터 분석/파이썬 Basic & EDA 2022. 7. 15. 22:19

파이썬 기초 - 조건문, Numpy, Pandas

If문 money = False if money: print("택시를 타고 가라") else: print("걸어가라") if money: print("택시를") print("타고") print("가라") money = 2000 card = True if money>=3000 or card: print("택시를 타고 가라") else: print("걸어 가라") 'a' in ('a','b','c') 'j' not in 'python' pocket = ['paper','cellphone','money'] if 'money' in pocket: print("택시를 타고 가라") else: print("걸어 가라") pocket = ['paper','cellphone'] card = True if 'money'..

데이터 분석/파이썬 Basic & EDA 2022. 7. 15. 12:08

Pandas - apply method 활용 & 문자열 처리 기본

apply 메소드 사용자가 작성한 함수를 한번에 적용하여 실행할 수 있게 해주는 메소드 함수를 브로드캐스팅할 때 사용 for문을 사용하는 것과 같은 결과 출력, 하지만 더 빠르다. 함수의 기본 구조 def my_function(): 인자가 1개인 함수 my_sq(x) def my_sq(x): return x **2 print(my_sq(4)) → 16 인자가 2개인 함수 my_exp(x,n) def my_exp(x,n): return x**n print(my_exp(2,4)) → 16 시리즈에 적용 apply 사용 x o 비교 (결과는 같음) import pandas as pd df = pd.DataFrame({'a':[10,20,30],'b':[20,30,40]}) print(df) #apply 적용x..

데이터 분석/파이썬 Basic & EDA 2022. 7. 13. 23:22

Pandas - 그룹 연산

데이터를 집계하거나 변환할 때, 한번에 처리하기 위해서 split-apply-combine(분할-반영-결합) 과정을 거쳐야한다. SQL의 GROUP BY 구문과 비슷하다. from google.colab import files myfiles = files.upload() import pandas as pd df = pd.read_csv('gapminder.tsv',sep='\t') avg_life_exp_by_year = df.groupby('year').lifeExp.mean() print(avg_life_exp_by_year) 분할 작업 : 먼저 데이터를 중복 없이 추출 years = df.year.unique() print(years) 반영 작업 : loc을 이용, 1952년의 데이터를 추출 y19..

데이터 분석/파이썬 Basic & EDA 2022. 7. 12. 09:22

이전 Prev 1 Next 다음

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

LITTLE BY LITTLE

목록데이터 분석/파이썬 Basic & EDA (5)

LITTLE BY LITTLE

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역