AI

[AI 도전기 10일차] 훈련 세트 & 테스트 세트 & 검증 세트로 교차 검증하기

alsruds 2024. 4. 6. 01:45

 

이전 강의에서까지 훈련 세트와 테스트 세트로 나눴던 방식은 이해를 돕기 위해서 란다 .. !!

사실은 3개로 나눠 교차 검증을 하는 방식이 바람직한 것이었다 💡!

 

https://www.youtube.com/watch?v=ZaIKUvHquEQ&list=PLJN246lAkhQjoU0C4v8FgtbjOIXxSs_4Q&index=12


 

12강. 교차 검증과 그리드 서치

 

💡 검증 세트 도입하기

 

- 훈련 세트 : 테스트 세트 튜닝

- 테스트 세트 : 서비스 성능 예측

- 검증 세트 : 매개변수 튜닝

 

1. 훈련 세트로 모델 구현

2. 검증 세트로 튜닝 : best parameter 탐색

3. 훈련 & 검증 세트 → 최종 모델 훈련

4. 테스트 세트로 정확성 테스트

 

 

💡 교차 검증하는 방법

 

- cross_validate : 3개의 폴더로 나누기

- dt : 매개변수

 

- cv : 현재보다 더 많은 폴더를 사용하고 싶을 때 사용

  - 회귀 모델일 때 : KFold()

  - 분류 모델일 때 : StratifiedKFold()

- splitter : 폴드를 나누는 행위를 디테일하게 제어

 

- 검증 세트를 돌아가면서 사용하기 때문에 효율적이다

- 폴드 개수만큼 점수를 얻은 후 평균을 낸다 (현재 폴드 개수 : 3개)

- 기본 5폴드 제공

 

 

💡 최종 모델 훈련하기 : 그리드 서치

 

- 그리드 서치 = 일정 간격으로 탐색

- min_impurity_decrease : 테스트 매개변수

  → 최적의 파라미터 찾기

- np.arrange(0.0001, 0.001, 0.0001) : 0.0001 부터 0.001 까지 0.0001 씩 증가

 

 

 

 

 

 

💡 최종 모델 훈련하기 : 랜덤 서치

 

- n_iter = 100 : 샘플링 100번

 

 

 

 

 

 

 

➡️ 랜덤 서치가 더 효율적이다 !