와인 예제를 이용해 결정 트리를 알아보자 🍷
https://www.youtube.com/watch?v=tOzxDGp8rsg&list=PLJN246lAkhQjoU0C4v8FgtbjOIXxSs_4Q&index=11
11강. 로지스틱 회귀로 와인 분류하기 & 결정 트리
📍 시나리오
캔 안에 들어있는 음료가 레드 와인인지 화이트 와인인지 알고 싶다 !!
- 가지고 있는 데이터 : 알코올 도수, 당도, pH
- 레드 와인이 음성 클래스 : 0
- 화이트 와인이 양성 클래스 : 1
- 이진 분류
💡 결정 트리
- 굉장히 높은 정확도를 가지고 있다
- max_features : 사용할 특성의 개수 (현재 3개)
if) none → 모든 특성 사용
- max_depth : depth 크기 지정 가능
- 양성 클래스의 개수가 많을수록 노드의 색깔이 진하다
- filled = True : 색칠 기능
- 파란색 : 양성 클래스
- 붉은색 : 음성 클래스
💡 노드 분할하기 : 지니 불순도
- 어떤 기준으로 노드를 분할할 것인가?
➡️ ' 부모의 불순도 - 자식의 불순도 ' 가 가장 크게 되도록
➡️ leaf 노드가 순수 노드가 되도록
💡 노드 분할하기 : 가지치기 (Pruning)
- 분할을 하는 기준을 학습한다
- 🌟 특성의 scale 을 조정할 필요가 없다 → 전처리가 필요없다!
- 특성 중요도 (feature_importances_)
- sugar 가 제일 중요하다
- pH 는 거의 영향을 미치지 않는다
'AI' 카테고리의 다른 글
[AI 도전기 11일차] 혼공머신 강의 수강 후 내 프로젝트 중간 점검 (0) | 2024.04.08 |
---|---|
[AI 도전기 10일차] 훈련 세트 & 테스트 세트 & 검증 세트로 교차 검증하기 (0) | 2024.04.06 |
[AI 도전기 8일차] 분류 모델에서 확률 구하기 : 로지스틱 회귀와 확률적 경사 하강법 (0) | 2024.04.03 |
[AI 도전기 7일차] 회귀 알고리즘과 모델 규제에 대해 알아보자 ! (0) | 2024.04.02 |
[AI 도전기 6일차] 훈련 세트와 테스트 세트 데이터 다루기 (0) | 2024.04.01 |