이전 강의에서까지 훈련 세트와 테스트 세트로 나눴던 방식은 이해를 돕기 위해서 란다 .. !!
사실은 3개로 나눠 교차 검증을 하는 방식이 바람직한 것이었다 💡!
https://www.youtube.com/watch?v=ZaIKUvHquEQ&list=PLJN246lAkhQjoU0C4v8FgtbjOIXxSs_4Q&index=12
12강. 교차 검증과 그리드 서치
💡 검증 세트 도입하기
- 훈련 세트 : 테스트 세트 튜닝
- 테스트 세트 : 서비스 성능 예측
- 검증 세트 : 매개변수 튜닝
1. 훈련 세트로 모델 구현
2. 검증 세트로 튜닝 : best parameter 탐색
3. 훈련 & 검증 세트 → 최종 모델 훈련
4. 테스트 세트로 정확성 테스트
💡 교차 검증하는 방법
- cross_validate : 3개의 폴더로 나누기
- dt : 매개변수
- cv : 현재보다 더 많은 폴더를 사용하고 싶을 때 사용
- 회귀 모델일 때 : KFold()
- 분류 모델일 때 : StratifiedKFold()
- splitter : 폴드를 나누는 행위를 디테일하게 제어
- 검증 세트를 돌아가면서 사용하기 때문에 효율적이다
- 폴드 개수만큼 점수를 얻은 후 평균을 낸다 (현재 폴드 개수 : 3개)
- 기본 5폴드 제공
💡 최종 모델 훈련하기 : 그리드 서치
- 그리드 서치 = 일정 간격으로 탐색
- min_impurity_decrease : 테스트 매개변수
→ 최적의 파라미터 찾기
- np.arrange(0.0001, 0.001, 0.0001) : 0.0001 부터 0.001 까지 0.0001 씩 증가
💡 최종 모델 훈련하기 : 랜덤 서치
- n_iter = 100 : 샘플링 100번
➡️ 랜덤 서치가 더 효율적이다 !
'AI' 카테고리의 다른 글
[AI 도전기 12일차] Tensorflow 2 기초 맛보기 (0) | 2024.04.09 |
---|---|
[AI 도전기 11일차] 혼공머신 강의 수강 후 내 프로젝트 중간 점검 (0) | 2024.04.08 |
[AI 도전기 9일차] 결정 트리에서의 이진 분류에 대해 알아보자 ! (0) | 2024.04.04 |
[AI 도전기 8일차] 분류 모델에서 확률 구하기 : 로지스틱 회귀와 확률적 경사 하강법 (0) | 2024.04.03 |
[AI 도전기 7일차] 회귀 알고리즘과 모델 규제에 대해 알아보자 ! (0) | 2024.04.02 |