혼공단/혼공단 5기

[혼공단 5기] 혼자 공부하는 머신러닝 + 딥러닝 1주차 후기 및 미션 인증

하양훈 2021. 1. 29. 21:16
반응형

0. 혼공단 5기를 시작하게 된 이유

혼공단은 이전에도 참여를 했던 프로그램이기도 합니다. 3기에서는 파이썬, 4기에선 자바를 신청해서 각각의 언어를 배우면서 전공실력을 키웠는데요. 이전에 신청한 3, 4기는 학교에서 배우는 전공실력을 키우는데 집중하는 용도로 했던 것이라면 이번에 신청한 혼공단 5기인 머신러닝+딥러닝은 제 꿈을 이루기 위한 한 발짝으로 지원을 했습니다.

 

대학교에 입학한 뒤 데이터 분석가라는 꿈을 이루기 위해 여러 강의를 들으면서 실력을 키우던 중 최근 한빛미디어에서 혼자 공부하는 머신러닝+딥러닝이 출간된 소식을 듣고 구매를 하고 방학에 공부할 준비를 하고 있었는데, 기말고사 기간중 마침 혼공단 5기에 머신러닝과 딥러닝 과목이 새로 신설된다는 소식을 듣고 이렇게 지원하게 되었습니다. 6주간의 기간동안 머신러닝의 알짜배기를 공부해서 습득한뒤 추후에 딥러닝까지 모두 배워서 기본기가 탄탄한 분석가가 되는게 제 목표입니다.

 

<진도표>

[이번주 과제 - 1주차]

1. 진도 공부 : 1장 나의 첫 머신러닝 ~ 2장 데이터 다루기

2. 기본 미션 : 코랩 실습 화면 인증샷

3. 선택 미션 : 2-1절 문제 풀고 인증샷

1. 진도 공부

 

1) 혼자 공부 하는 머신러닝 + 딥러닝 1장 - 인공지능의 정의 및 개발환경 세팅(Colab)

 

- 링크 :  https://sirokun.tistory.com/12

 

혼자 공부하는 머신러닝 1장 - 인공지능의 정의 및 개발환경 세팅(Colab)

1. 인공지능의 정의와 역사 <인공지능이란?> 인공지능 : 사람처럼 학습하고 추론할 수 있는 지능을 가진 컴퓨터 시스템 <인공지능의 역사> - 1943년 워런 매컬러와 윌터 피츠가 최초로 뇌의 뉴런 개

sirokun.tistory.com

 

2) 혼자 공부 하는 머신러닝 + 딥러닝 1장 - 머신러닝 예제연습 (K-최근접 이웃)

 

링크 : https://sirokun.tistory.com/13

 

혼자 공부하는 머신러닝 1장 - 머신러닝 예제연습(K-최근접 이웃)

'혼자 공부하는 머신러닝'에 나오는 도미와 빙어 예재로 머신러닝 예제를 연습해보도록 하자. 1. 도미 데이터 준비 출처 : http://bit.ly/bream_list bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7,..

sirokun.tistory.com

 

3) 혼자 공부하는 머신러닝 + 딥러닝 2장 - 데이터 다루기

 

링크 : https://sirokun.tistory.com/14

 

혼자 공부하는 머신러닝 2장 - 데이터 다루기

1. 훈련 세트와 테스트 세트 <지도 학습과 비지도 학습> - 지도 학습 : 입력과 타깃을 전달하여 모델을 훈련한 다음 새로운 데이터를 예측하는데 활용 - 비지도 학습 : 타깃 데이터 없이, 입력 데이

sirokun.tistory.com

이번주에는 실습환경을 설치하고 기본적인 이론을 배우는게 주 내용이었습니다.

 

사실 이전에 데이터 분석을 하면서 여러 강의를 들은 적이 있기에 코랩같은 노트북 환경이 익숙해서 이번에는 조금 빠르게 실습을 할 수 있지 않았나 싶습니다. 대체적으로 코드도 쉬웠고, 내용도 친절하게 설명하고 있어서 금방 익힐 수 있었습니다. 공부하면서 각 장별로 기억해야할 내용은 따로 기록하기위해 위와 같이 포스팅도 했습니다.

 

2. 기본미션 : 코랩 실습 화면 인증샷

 

기본미션은 코랩 실습화면 인증샷입니다.

인증은 간단하게 이번에 실습 예제로 나온 K-최근접 이웃 알고리즘으로 인증해보겠습니다!

 

3. 선택미션 : 2-1절 문제 풀고 인증샷

 

 

선택 미션인 2-1절 문제 풀고 인증샷도 이렇게 인증해보겠습니다.

간단하게 풀이를 해보면 아래와 같습니다.

 

<1번문제 풀이>

 

- 지도학습 : 샘플의 입력과 타깃이 준비되어 있을때 사용하는 머신러닝 알고리즘

- 비지도학습 : 타깃이없는 데이터에 적용하는 머신러닝 알고리즘

- 차원축소 : 비지도 학습의 하나로 데이터가 가지고 있는 특성의 개수를 줄이는 방법

- 강화학습 : 주어진 환경으로부터 보상을 받아 학습하는 머신러닝 알고리즘

 

<2번문제 풀이>

 

- 훈련세트와 테스트 세트가 잘못 만들어져 전체 데이터를 대표하지 못하는 현상을 샘플링 편향이라고 한다.

 

<3번문제 풀이>

 

- 사이킷런은 입력 데이터 배열의 행엔 샘플로, 열엔 특성으로 구성되어 있을 것으로 기대하고 있다.

 


이것으로 1주차 후기를 마쳐보겠습니다. 첫 주에는 개발환경 설정과 약간의 맛보기여서 쉽게 배웠지 그럼에도 기본적인 내용을 탄탄하게 배울수 있어서 무척 만족스러웠던 한 주 였습니다.

다음 주차도 열심히 달려서 마지막 6주차에는 좀 더 자신있게 머신러닝을 다루는 제 모습이 되어있으면 좋겠네요!

반응형