| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- 캐글 신용카드 사기 검출
- 부트 스트래핑
- 스태킹 앙상블
- splitlines
- WITH CUBE
- ARIMA
- 그로스 마케팅
- 리프 중심 트리 분할
- 그룹 연산
- tableau
- 그로스 해킹
- lightgbm
- 데이터 정합성
- WITH ROLLUP
- 마케팅 보다는 취준 강연 같다(?)
- python
- 3기가 마지막이라니..!
- 컨브넷
- 데이터 증식
- sql
- Growth hacking
- 인프런
- DENSE_RANK()
- pmdarima
- 데이터 핸들링
- 캐글 산탄데르 고객 만족 예측
- 분석 패널
- ImageDateGenerator
- 로그 변환
- XGBoost
- Today
- Total
목록전체 글 (193)
LITTLE BY LITTLE
Ch_02 Basic Structure Pandas_Data_Structure DataFrame_Operations max([row[3] for row in data]) 넘파이 배열 numpy array 에서 => dictionary로 변환 : { col : np.array(row[i] for row in data]) for i, col in enumerate(data.dtypes.names)} np.linspace(start,stop,num=)로 넘파이 배열 생성 넘파이 배열 numpy array 에서 => dataframe로 변환 : pd.DataFrame(array_dict) 시리즈 생성 => pd.Series(딕셔너리['컬럼 이름'], name=이름지정) pd.Series(numbers, inde..
ch_03. wide_vs_long wide가 일반적으로 많이 본 형태, describe로 한 눈에 볼때 편리, pandas의 matplotlib로 시각화 long은 컬럼명이 data type과 value로 구성, describe하기에 적절치 않음, seaborn으로 시각화 using_the_weather_api cleaning_data df.rename(str.supper(axis='columns').columns pd.to_datetime(df.col) pd.tz_localize(), pd.tz_convert(), pd.tz_localize(None).to_period('M').to_timestamp().index assign()으로 한번에 데이터 타입 변경 (df.col.astype('int' or..
개요 코드화란? 고차원에서 저차원으로 바꾸는 것 인코더와 디코더의 개념 픽셀-수준의 예측 (=픽셀에 대한 분류가 Segmentation, 즉 분할이 분류인 것) 디코딩 : 고차원 데이터를 출력하기 위함 FCN (Dense Layer을 없애고, 대신에 Fully Convolutional Network 사용, Segmentation을 위함) U-Net (U의 형태를 갖고 있으며, 인코더와 디코더 부분으로 나뉘어져 있음) 인코딩(=압축)과 디코딩(=압축 해제, 타겟 도메인으로 매핑) 인코더 : 입력 샘플을 잠재공간, 즉 숨겨진 구조화 값 집합에 매핑하는 함수 *잠재공간 : 입력공간과 타겟공간보다 작음 샘플에 포함된 의미론적 정보를 추출/압축 하기 위해 설계 또는 훈련된다. 디코더 : 이 잠재공간의 요소를 사전..
Faster R-CNN 아키텍처 ( 두 단계로 작동) 관심 영역(ROI, Region of Interest) 추출 - 각 이미지에 대하여 약 2,000개의 ROI를 생성한다. 분류 단계(혹은 탐지 단계) - 2,000개 각각에 대해 합성곱 네트워크의 입력에 맞춰 정사각형으로 크기를 조정함 이 단계에서 CNN을 사용하여 ROI를 분류한다. 1단계. 영역 제안 RPN (Region Proposal Network, 영역 제안 네트워크)를 사용하여 ROI를 생성한다. 합성곱 계층을 사용한다. ( 특징맵 좌표계로 전환됨 - 예제에서 CNN의 보폭은 16이다 => 좌표는 16으로 나누어진다. 2-2. 각 ROI크기를 조정해 완전 연결 계층의 입력과 맞춘다. 2-3. 완전 연결 계층을 적용하고, 여기에서 특징 벡터를..
2부. 전통적 인식 문제를 해결하는 최신 솔루션 04. 유력한 분류 도구 (고급 CNN아키텍처의 이해 - VGG, GoogleLeNet, Inception,ResNet[잔차 네트워크], 전이학습) 05. 객체 탐지 모델(YOLO, Faster R-CNN, 텐서플로 객체 탐지 API) 06. 이미지 보강 및 분할 (인코더-디코더로 이미지 변환, 노이즈 제거, 객체 분할) 3부. 컴퓨터 비전의 고급 개념 및 새 지평 07. 복합적이고 불충분한 데이터셋에서 훈련시키기 (입력 파이프라인, 데이터셋 보강, VAE와 GAN) 08. 동영상과 순환 신경망 (RNN, 장단기 메모리 셀, LSTM으로 동영상 분류하기) 09. 모델 최적화 및 모바일 기기 배포 (계산 및 디스크 용량 최적화, 온디바이스 머신러닝, Mobi..
7. 군집화 K-평균 알고리즘 이해 군집 평가 평균 이동 (Mean shift) GMM(Gaussian Mixture Model) DBSCAN 군집화 실습 - 고객 세그먼테이션 정리 더보기 차원 축소 LDA (Linear Discriminant Anlysis) SVD (Singular Value Decomposition) NMF (Non-Negative Matrix Factorization) 정리 회귀 다항 회귀와 과(대)적합/과소적합 이해 규제 선형 모델 - 릿지, 라쏘, 엘라스틱 넷 로지스틱 회귀 회귀 트리 회귀 실습 - 자전거 대여 수요 예측 회귀 실습 - 캐글 주택 가격 : 고급 회귀 기법 정리 텍스트 분석 텍스트 분석 이해 텍스트 사전 준비 작업(텍스트 전처리) - 텍스트 정규화 Bag of W..
2부. 전통적 인식 문제를 해결하는 최신 솔루션 04. 유력한 분류 도구 (고급 CNN아키텍처의 이해 - VGG, GoogleLeNet, Inception,ResNet[잔차 네트워크], 전이학습) 05. 객체 탐지 모델 (YOLO, Faste R-CNN, 텐서플로 객체 탐지 API) 06. 이미지 보강 및 분할 (인코더-디코더로 이미지 변환, 노이즈 제거, 객체 분할) 3부. 컴퓨터 비전의 고급 개념 및 새 지평 07. 복합적이고 불충분한 데이터셋에서 훈련시키기 (입력 파이프라인, 데이터셋 보강, VAE와 GAN) 08. 동영상과 순환 신경망 (RNN, 장단기 메모리 셀, LSTM으로 동영상 분류하기) 09. 모델 최적화 및 모바일 기기 배포 (계산 및 디스크 용량 최적화, 온디바이스 머신러닝, Mobi..
6. 차원 축소 차원 축소의 개요 PCA (Principal Component Anlysis) LDA (Linear Discriminant Anlysis) SVD (Singular Value Decomposition) NMF (Non-Negative Matrix Factorization) 정리 7. 군집화 K-평균 알고리즘 이해 군집 평가 평균 이동 (Mean shift) GMM(Gaussian Mixture Model) DBSCAN 군집화 실습 - 고객 세그먼테이션 정리 더보기 회귀 다항 회귀와 과(대)적합/과소적합 이해 규제 선형 모델 - 릿지, 라쏘, 엘라스틱 넷 로지스틱 회귀 회귀 트리 회귀 실습 - 자전거 대여 수요 예측 회귀 실습 - 캐글 주택 가격 : 고급 회귀 기법 정리 텍스트 분석 텍스트..