혼공단/혼공단 5기

[혼공단 5기] 혼자 공부하는 머신러닝 + 딥러닝 4주차 후기 및 미션 인증

하양훈 2021. 2. 19. 14:36
반응형

<진도표>

[이번주 과제 - 4주차]

1. 진도 공부 : 5장 트리 알고리즘

2. 기본 미션 : 교차 검증을 그림으로 설명하기

3. 선택 미션 : 5-3절 앙상블 모델 손코딩 코랩 화면 인증샷

1. 진도 공부

 

1) 혼자 공부 하는 머신러닝 + 딥러닝 5장 - 결정 트리

 

링크 : sirokun.tistory.com/23

 

혼자 공부하는 머신러닝 + 딥러닝 5장 - 결정 트리

1. 결정트리 - 여러 단계의 복잡한  조건을 갖는 문제와 그 조건과 그에 따른 해결방법을 트리 형태로 나타낸 것. 모든 비종점 노드가 하나의 결정을 나타내는 이진트리. - 사이킷런의 DecisionTreeCl

sirokun.tistory.com

 

2) 혼자 공부 하는 머신러닝 + 딥러닝 5장 - 교차 검증과 그리드 서치

 

링크 : sirokun.tistory.com/24

 

혼자 공부하는 머신러닝 + 딥러닝 5장 - 교차 검증과 그리드 서치

1. 교차 검증 <검증 세트> - 테스트 세트를 사용하지 않고 모델이 과대적합인지, 과소적합인지 판단하는 방법. - 보통 전체 데이터중 20%를 테스트 세트로 80%를 훈련세트로 만든 뒤, 이 훈련 세트중

sirokun.tistory.com

 

3) 혼자 공부 하는 머신러닝 + 딥러닝 5장 - 트리의 앙상블

 

링크 : sirokun.tistory.com/25

 

혼자 공부하는 머신러닝 + 딥러닝 5장 - 트리의 앙상블

1. 정형 데이터와 비정형 데이터 & 앙상블 학습 <정형 데이터와 비정형 데이터> - 정형 데이터 : 구조가 정해져 있고 가지런히 정리된 데이터 - 비정형 데이터 : 데이터베이스나 엑셀로 표현하기

sirokun.tistory.com

 

이번주에는 결정 트리 및 앙상블에 대한 내용이 주를 이뤘습니다. 저번주에 배웠던 회귀와 분류 모델과 비슷한 듯 했지만, 일단 기본적인 알고리즘 조차 다르기도 했고, 엄청나게 많은 모델 이름들이 등장한던 터라 초반에 약간은 겁을 먹긴 했습니다. 하지만 다양한 모델들의 기본이 결정 트리에 있다는 것을 알게 되었고, 결정 트리를 제대로 이해하고 나니 나머지 모델들은 그 응용버전이어서 생각보다 이해하기 수월하더라고요. 교차검증이나 그리드 서치도 정확하게 훈련하는 모델을 찾기 위해 꼭 거쳐야 하는 과정이고, 이를 위해 어떤 식으로 수행하는지의 맥락을 짚다보니 쉽게 이해할 수 있었던 것 같았습니다.

 

 

2. 기본미션 : 교차 검증을 그림으로 설명하기

 

기본미션은 교차검증을 그림으로 설명하기입니다.

교차검증에 대한 설명은 진도 공부를 하면서 정리한 게시물에 적어놓기도 했습니다.

 

 

교차검증은 검증 세트를 떼어내는 과정을 여러번 반복 하는 것을 말하며, 위와 같이 훈련세트 중 일부를 번갈아 가면서 수행합니다. 이때 수행 횟수에 따라 몇 폴드 교차 검증법이라고 불러지는지가 달라집니다

 

Ex) 다섯번에 걸쳐서 수행 → 5 - 폴드 교차 검증

 

 

3. 선택미션 : 5-3절 앙상블 모델 손코딩 코랩 화면 인증샷

 

1) 랜덤 포레스트

 

 

2) 엑스트라 트리

 

3) 그레이디언트 부스팅

 

4) 히스토그램 기반 그레이디언트 부스팅

 

 

5) XGBoost

 

6) LightGBM

선택미션은 5-3절 앙상블 모델 손코딩 코랩 화면 인증샷입니다. 5-3절에서 정말 다양한 앙상블 모델이 나왔는데, 이를 하나하나 실행해보면서 인증샷을 찍었고, 이 모든 모델을 익히느라 조금은 힘들었지만 예전부터 궁금했던 모델들을 한번에 정리할 수 있었던 좋은 기회였기에 정말 많은 걸 배워갔던 것 같습니다.


이것으로 4주차 후기를 마쳐보겠습니다. 

사실 이번주에 배웠던 모델들은 최근에 시작한 캐글스터디에서 배웠던 부분이 많아서 뜻하지 않게 반갑기도(?) 했습니다. 스터디 당시에는 일단 실행하고 보자는 마음에 이론공부는 잠시 뒤로 미룬 상태였는데, 이렇게 혼공단 수업을 통해 모자랐던 지식을 채울 수 있어서 너무 좋았다고 생각합니다. 그 당시에 왜 이 모델을 썼는지 그냥 빠르게 지나갔었는데, 이제는 그 이유를 알 것 같습니다. 그래서인지 더욱 보람차고 배운게 많았다고 느껴진 한주였고, 공부 정리를 한 포스팅에도 더 매진한게 아닌가 싶네요. 

다음주 부터는 이제 지도학습을 끝내고 비지도 학습으로 들어가는데, 이건 또 다른 미지의 영역이라 어떤 내용이 나올지 기대되고 무섭기도 합니다. 그래도 늘 해오던 것처럼 잘 헤쳐나갈거라고 굳게 믿고 있습니다!!

 

 

 

 

 

반응형