반응형

전체 글 78

혼자 공부하는 머신러닝 + 딥러닝 3장 - 특성 공학과 규제

1. 다중회귀 - 다중회귀 : 여러개의 특성을 사용한 선형회귀 - 특성공학 : 기존의 특성을 사용해 새로운 특성을 뽑아내는 작업 Ex) 특성이 a,b,c 인경우 특성공학을 이용하면 a^2, ab, abc 등의 특성을 만들 수 있다. - 사이킷런에서 특성을 만들거나 전처리 하기 위한 다양한 클래스 - 변환기 클래스에서는 모두 fit(), transform()을 제공한다. Ex) PolynomialFeatures 클래스로 만들어본 특성을 가진 샘플들 from sklearn.processing import Polynomial Features poly = PolynomialFeatures() poly.fit([[2,3]]) print(poly.transform([[2,3]])) >> [[1. 2. 3. 4. 6..

혼자 공부하는 머신러닝 + 딥러닝 3장 - 선형 회귀

- k-최근접 이웃 회귀는 가장 가까운 샘플을 찾아 타깃을 평균한다. 따라서 새로운 샘플이 훈련 세트의 범위를 벗어나면 엉뚱한 값을 예측할 수 있다. 1. 선형 회귀 - 널리 사용되는 대표적인 회귀 알고리즘 중 하나 - 특성이 하나인 경우 그 특성을 가장 잘 나타내는 어떤 직선을 학습하는 알고리즘. - sklearn.linear_model 패키지 아래에 LinearRegression 클래스로 구현 가능. - 사이킷런의 모델 클래스들은 훈련(fit),평가(score),예측(predict)하는 메서드 이름이 동일함 - 주어진 데이터 셋으로 아래와 같은 그래프를 그릴 수 있다. - LinearRegression 클래스에선 위와 같은 그래프에서 가장 잘 맞는 a,b값을 찾는다. 이때 a를 coef_, b를 in..

혼자 공부하는 머신러닝 + 딥러닝 3장 - k-최근접 이웃 회귀

1. k-최근접 이웃 회귀 - 지도학습 알고리즘은 크게 분류와 회귀로 나눔. - 분류 : 샘플을 몇 개의 클래스 중 하나로 분류하는 것 - 회귀 : 임의의 어떤 숫자를 예측하는 문제, 두 변수 사이의 상관관계를 분석하는 방법 1) k-최근접 이웃 분류 알고리즘 - 예측하려는 샘플에 가장 가까운 샘플 k개를 선택한 뒤, 이 샘플들의 클래스를 확인하여 가장 많은 클래스를 새로운 샘플의 클래스로 예측 한다. 1) k-최근접 이웃 회귀 알고리즘 - 예측하려는 샘플에 가장 가까운 샘플 k개를 선택한 뒤, 이 샘플들의 수치를 확인하여 그들의 평균을 새로운 샘플의 클래스의 타깃값으로 예측 한다. 2. 결정계수 - 사이킷런에서 k-최근접 이웃 회귀 알고리즘을 구현한 클래스는 KNeighborsRegressor - 분류..

[혼공단 5기] 혼자 공부하는 머신러닝 + 딥러닝 1주차 후기 및 미션 인증

0. 혼공단 5기를 시작하게 된 이유 혼공단은 이전에도 참여를 했던 프로그램이기도 합니다. 3기에서는 파이썬, 4기에선 자바를 신청해서 각각의 언어를 배우면서 전공실력을 키웠는데요. 이전에 신청한 3, 4기는 학교에서 배우는 전공실력을 키우는데 집중하는 용도로 했던 것이라면 이번에 신청한 혼공단 5기인 머신러닝+딥러닝은 제 꿈을 이루기 위한 한 발짝으로 지원을 했습니다. 대학교에 입학한 뒤 데이터 분석가라는 꿈을 이루기 위해 여러 강의를 들으면서 실력을 키우던 중 최근 한빛미디어에서 혼자 공부하는 머신러닝+딥러닝이 출간된 소식을 듣고 구매를 하고 방학에 공부할 준비를 하고 있었는데, 기말고사 기간중 마침 혼공단 5기에 머신러닝과 딥러닝 과목이 새로 신설된다는 소식을 듣고 이렇게 지원하게 되었습니다. 6주..

혼자 공부하는 머신러닝 + 딥러닝 2장 - 데이터 다루기

1. 훈련 세트와 테스트 세트 - 지도 학습 : 입력과 타깃을 전달하여 모델을 훈련한 다음 새로운 데이터를 예측하는데 활용 - 비지도 학습 : 타깃 데이터 없이, 입력 데이터에서 어떤 특징을 찾는데 주로 활용 - 훈련 세트(train set) : 훈련에 사용되는 데이터,입력(데이터) + 타깃(정답) - 테스트 세트(test set) : 평가에 사용하는 데이터 - 머신러닝의 정확한 평가를 위해서는 테스트 세트와 훈련세트가 따로 준비되어 있는게 좋다. - 샘플링 편향 : 훈련세트와 테스트세트가 골고루 섞여있지 않아 샘플링이 한쪽으로만 치우친 상태 - 특정 종류의 샘플이 과도하게 많은 샘플링 편향을 가지고 있다면 제대로 된 지도 학습 모델을 만들 수 없다. 1) 넘파이 활용(다른 방법도 있으나 일단 2장에 소..

혼자 공부하는 머신러닝 + 딥러닝 1장 - 머신러닝 예제연습(K-최근접 이웃)

'혼자 공부하는 머신러닝'에 나오는 도미와 빙어 예재로 머신러닝 예제를 연습해보도록 하자. 1. 도미 데이터 준비 출처 : http://bit.ly/bream_list bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0,..

혼자 공부하는 머신러닝 + 딥러닝 1장 - 인공지능의 정의 및 개발환경 세팅(Colab)

1. 인공지능의 정의와 역사 인공지능 : 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템 - 1943년 워런 매컬러와 윌터 피츠가 최초로 뇌의 뉴런 개념 발표 - 1950년에는 앨런 튜링이 인공지능이 사람과 같은 지능을 가졌는지 테스트할 수 있는 튜링 테스트 발표 - 1956년 다트머스 AI 컨퍼런스에 인공지능에 대한 전망이 최고조, 이 시기를 인공지능 태동기라고 함. - 1957년 프랑크 로젠블라트가 로지스틱회귀의 초기버전인 퍼셉트론을 발표 - 1959년 데이비드 허블과 토르스텐 비셀이 고양이를 사용해 시각피질에 있는 뉴런 기능을 연구함, 이 두 시기를 인공지능 황금기라고 함. - 하지만 컴퓨터 성능으로 인한 한계로 첫번째 AI겨울이 옴 - 후에 전문가 시스템이 등장하고 AI붐이 또 불었지..

혼공단 2021.01.27

환영합니다!

#1 글을 작성하고 블로그를 관리해보세요. 하양훈님의 회원 가입을 진심으로 축하합니다. 이 글은 비공개로 작성돼 있습니다. '편집'으로 내용을 바꾸시거나, 삭제 후 '새 글을 작성'하셔도 됩니다. 글 뿐만 아니라 블로그의 각종 설정을 변경할 수도 있습니다. '블로그관리'를 확인해보세요. #2 다양한 스킨이 있어요. 티스토리에 있는 다양한 '스킨'도 살펴 보세요. 블로그나 사이트를 사용하는 목적에 맞게 스킨을 고를 수 있습니다. 어떤 이야기를 주로 하실 건가요? 잘 생각해 보시고, 마음에 드는 스킨을 고르세요. '스킨 편집'을 통해 다양한 커스텀, 그리고 홈 꾸미기를 적용하실 수도 있답니다. #3 포럼에서 사람들과 소통하세요. 마지막으로 사용하시다가 티스토리에 대해 궁금한 내용이 있다면 '포럼'을 확인하세..

카테고리 없음 2021.01.19
반응형