지난 시간에 RecBole, RecBole-GNN 레포지토리 clone 했으니 이번엔 데이터셋을 연결해보겠다
준비한 데이터셋 : RecSysDatasets 에서 제공하는 Food 데이터셋
준비한 데이터셋을 폴더에 넣어주자 - RecBole/dataset 하위에 넣어주어야 한다
준비한 데이터셋으로 모델을 트레이닝 하기 위해서는 yaml 파일을 구성해주어야 한다 (3개나 ㄷㄷㄷ ㄷ ㄷ. ㄷㄷ. ㄷ)
설마 공식 데이터셋인데 뭐가 없고 이러진 않겠지....
1. RecBole/recbole/properties/overall.yaml
# Training Settings 에 train_batch_size 만 바꿨어요
2. RecBole/recbole/properties/dataset/Food.yaml
준비한 데이터셋의 이름과 동일하게 yaml 파일을 RecBole/recbole/properties/dataset 에 만들어준다
- 같이 들어있는 sample.yaml 에서 일단 코드를 복사해왔다
- 공식 문서로 세팅값에 대해 알아보자 (네 잘 봤습니다)
- sample.yaml 에서 아무 것도 바꾸지 않았다
3. RecBole/RecBole-GNN/recbole_gnn/properties/model/NGCF.yaml
사용하고자 하는 모델의 yaml 파일
나는 수정하지 않았다
💡 이제 트레이닝 해보자 ..
- 가상환경 실행 : source venv/Scripts/activate (activate 이 있는 경로)
- RecBole 폴더로 이동 : cd RecBole
- python RecBole-GNN/run_recbole_gnn.py --model='NGCF' --dataset='Food'
개 큰 오류 발생 : ModuleNotFoundError : No module named 'torch'
2024.10.15 - [ERROR] - ModuleNotFoundError: No module named 'torch'
ModuleNotFoundError: No module named 'torch'
지금부터 오류의 향연에 대한 여정이 시작되는데요.. ✈️미리 이야기 해드리자면, pytorch - cuda - nvidia driver 버전이 맞아야 합니다OS : Windows 11GPU 모델 : GeForce MX250pip 가상 환경 해결 방법 정리1. Py
alsrudalsrudalsrud.tistory.com
를 진짜 힘들게 해결 완료 😭
~ 훈련 중 ~
순항 중 입니다 ⛵
왤케 오래 걸려? 스타벅슨데.. 집에 가도 되나?
→ 가도 된다. 네트워크 환경 끊겨도 이어서 다시 된다
🌙 벌써 하루가 지났어요
하.. 중간에 노트북 꺼져서 처음부터 다시 시작했다
사실 트레이닝이 또 시작되길래 overall.yaml 보니까 epoch (반복 횟수) 가 300 으로 되어있었다.
300번 돌리면 노트북이 죽을 것 같다.
training 한 번 끝나고 나면, saved 파일에 결과가 저장되어서 epoch 돌 때마다 가장 좋은 결과가 저장된다고 한다.
추천 받는 건 이 saved 폴더 내 파일을 이용하는 거라 한다.
바빠 죽겠는데 300번 언제 돌려?
정확도는 떨어지겠지만..... 일단 이걸로 써봐야겠다
필요하면 나중에 또 돌릴게..
'AI' 카테고리의 다른 글
[AI] 레시피 추천 모델 만들기 8 - Inference (2) user 기반, item 기반 추천 받기 (3) | 2024.10.30 |
---|---|
[AI] 레시피 추천 모델 만들기 7 - Inference (1) 계획 수정.. (또획 또정) (5) | 2024.10.29 |
[SpringBoot/AI] 레시피 추천 모델 만들기 5 - RecBole GitHub Clone (0) | 2024.09.16 |
[AI] 레시피 추천 모델 만들기 4 - 계획 수정 (0) | 2024.09.11 |
[AI] 레시피 추천 모델 만들기 3 - RecBole (3) | 2024.09.10 |