본문 바로가기

개인 공부기록40

[hands-on-ml-2] 범주형 데이터 다루기 [hands-on-ml-2] 범주형 데이터 다루기 핸즈온 머신러닝2 ch2에서 다룬 내용입니다. ocean_proximity는 범주형 특성을 가지고 있습니다. 대부분의 머신러닝 알고리즘은 숫자를 다루므로 이 카테고리를 텍스트에서 숫자로 변환해야 합니다. housing_cat=housing["ocean_proximity"] housing_cat.head() 텍스트에서 숫자로 변환 (OrdinalEncoder) 1) pandas의 Series.factorize() 매서드 이용 housing_cat_encoded, housing_categories=housing_cat.factorize() print(housing_cat_encoded[:10]) print(housing_categories) 2) 사이킷런의 .. 2020. 7. 25.
[python-ds-handbook] NumPy [python-ds-handbook] NumPy 파이썬 데이터 사이언스 핸드북 Numpy 중 자주 쓰는 것 모음 NumPy 모듈 불러오기 import numpy as np random으로 배열 만들기 # 재현 가능성을 위한 시드 값 np.random.seed(0) # 3*3 배열, 0과 1 사이의 난수로 채움 np.random.random((3,3)) # 정규 분포(평균=0, 표준편차=1)의 난수로 채운 3*3 배열 np.random.normal(0,1,(3,3)) #[0,10] 구간의 임의의 정수로 채운 3*3 배열 np.random.randint(0,10,(3,3)) # 3*3 단위 행렬 만들기 np.eye(3, dtype=int) numpy 속성 x3=np.random.randint(10, size.. 2020. 7. 21.
아나콘다 가상환경 만들기 아나콘다 가상환경 만들기 1) 가상환경 만들기 터미널에 다음과 같이 써주면 sotudy 라는 이름의 가상환경이 만들어집니다. conda create -n sotudy python=3.7 2) 가상환경 리스트 보기 conda env list 3) 가상환경 활성화 conda activate sotudy 이렇게 (base)환경에서 (sotudy)로 가상환경이 활성화됩니다. 4) 가상환경 비활성화 conda deactivate 이렇게 하면 (sotudy)에서 (base)로 다시 바뀝니다. 5) 가상환경 삭제 conda env remove -n sotudy ※가상환경에 패키지 설치 새로 가상환경을 만들게 되면 기존에 있던 패키지들도 다시 깔아야 합니다. 물론 이 패키지 버전들이 겹쳐서 충돌할 수 있기 때문에 새로.. 2020. 7. 13.
[모두를 위한 머신러닝/딥러닝] ML [모두를 위한 머신러닝/딥러닝] ML 홍콩과기대 김성훈 교수님의 '모두를 위한 머신러닝/딥러닝' 머신러닝 (ch1~7) 머신러닝이란? - Field of study that gives computers the ability to learn without being explicitly programmed 개발자가 직접 어떻게 할지 정하는 것이 아니라 프로그램 자체가 데이터를 학습해서 뭔가를 배우게 하는 게 어떨까 하는 생각에서 시작 - supervised learning을 주로 설명 (label이 주어진 데이터로 학습) Cost function - loss function - 실제값과 예측값 사이의 거리를 나타낸 함수 - 이 Cost function을 가장 작게 만드는 값을 구하는 것이 학습의 목표 - c.. 2020. 7. 9.