본문 바로가기

Deep Learning/딥러닝 기초5

[패캠] Autoencoders Autoencoders [패스트캠퍼스] 김기현의 딥러닝을 활용한 자연어처리 입문 올인원 패키지 Part 1. 딥러닝 초급 Ch 02. Representation Learning - 01. 특징(feature)이란 Ch 02. Representation Learning - 02. 원핫 인코딩 Ch 02. Representation Learning - 03. 오토인코더 Ch 02. Representation Learning - 04. Hidden Representaion 강의를 듣고 작성하였습니다. 오토인코더라는 말을 많이 들어봤었는데, 정확히 뭘 의미하는건지 몰랐었다. 딥러닝 공부를 하다보면 인코더, 디코더 이런 얘기를 많이 들을 수 있는데 이번 강의를 통해 개념 정리를 할 수 있었다. Feature란? .. 2021. 12. 14.
[패캠] Dimension Reduction [패스트캠퍼스] 김기현의 딥러닝을 활용한 자연어처리 입문 올인원 패키지 Part 1. 딥러닝 초급 Ch 04. Geometric Perspective - 01. 차원의 저주 Ch 04. Geometric Perspective - 03. 매니폴드(Manifold) 가설 Ch 04. Geometric Perspective - 05. 정리하며 강의를 듣고 작성하였습니다. Curse of Dimensionality(차원의 저주) 차원이 높아짐에 따라 데이터가 희소하게 분포하게 되는 문제가 발생한다. 여기서 데이터가 희소하게 분포하는 것이 무엇인지에 대해 그동안 정확히 이해하지 못한채로 넘어갔었는데, 김기현 선생님께서 명확하게 설명해주셨다. 위의 그림처럼 1D에 데이터가 분포한다고 하면 4칸만 확인하면 데이터 분.. 2021. 11. 3.
[Hands-on-ml-2] 모델 평가 [Hands-on-ml-2] 모델 평가 핸즈온머신러닝 3장에서 MNIST 숫자 데이터를 분류하는 모델을 만들었습니다. 간편하게 알아보기 위해서 숫자가 5인지 아닌지를 분류하는 분류기를 SGDClassifier로 만들었습니다. 이제 다양한 모델 평가 지표를 활용하여 모델의 성능이 어떤지 평가할 것입니다. 각각의 모델 평가 지표에 대해 알아보겠습니다. 1. 교차 검증을 사용한 정확도 측정 k-fold 교차 검증 먼저, 모든 샘플을 k개의 크기가 같은 하위 샘플로 나눕니다. 이 k개의 샘플 세트는 돌아가면서 검정 세트가 됩니다. 이때 나머지 샘플들은 모델 훈련에 사용됩니다. 최종적으로 k번의 평가 지표의 평균값을 최종 평가 지표로 사용합니다. 사이킷런의 cross_val_cross() 함수로 폴드가 3개인 k.. 2020. 7. 30.
[hands-on-ml-2] 범주형 데이터 다루기 [hands-on-ml-2] 범주형 데이터 다루기 핸즈온 머신러닝2 ch2에서 다룬 내용입니다. ocean_proximity는 범주형 특성을 가지고 있습니다. 대부분의 머신러닝 알고리즘은 숫자를 다루므로 이 카테고리를 텍스트에서 숫자로 변환해야 합니다. housing_cat=housing["ocean_proximity"] housing_cat.head() 텍스트에서 숫자로 변환 (OrdinalEncoder) 1) pandas의 Series.factorize() 매서드 이용 housing_cat_encoded, housing_categories=housing_cat.factorize() print(housing_cat_encoded[:10]) print(housing_categories) 2) 사이킷런의 .. 2020. 7. 25.