AI

[AI 도전기 17일차] 음식 데이터 전처리하기

alsruds 2024. 4. 28. 18:12

📍 오늘 할 일 📍

음식 영양 정보 데이터에서 내가 필요한 정보만 남겨두자 !

 

📎사용한 데이터 📎

전국통합식품영양성분정보(음식)표준데이터

 

 

😭 시행착오들....

⬇️⬇️⬇️⬇️⬇️⬇️

 

csv 파일이 안불러와져요

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbd in position 0: invalid start byte

 

해결 방법 : encoding='cp949' 추가하기

 

 

tensorflow 설치가 안돼요

ERROR: Could not install packages due to an OSError: [Errno 2] No such file or directory: 'C:\\Users\\alsrud\\AppData\\Local\\Packages\\PythonSoftwareFoundation.Python.3.12_qbz5n2kfra8p0\\LocalCache\\local-packages\\Python312\\site-packages\\tensorflow\\include\\external\\com_github_grpc_grpc\\src\\core\\ext\\filters\\client_channel\\lb_policy\\grpclb\\client_load_reporting_filter.h' HINT: This error might have occurred since this system does not have Windows Long Path support enabled. You can find information on how to enable this at https://pip.pypa.io/warnings/enable-long-paths

 

해결 방법 : 관리자 권한으로 powershell 실행 후 long path behavior 활성화 (아래 명령 입력)

New-ItemProperty -Path "HKLM:\SYSTEM\CurrentControlSet\Control\FileSystem" -Name "LongPathsEnabled" -Value 1 -PropertyType DWORD -Force

Successfully installed !

 

 

😮 일단 완료 .. !

 

⚙️ 전체 코드

import pandas as pd

# 데이터 불러오기
data = pd.read_csv('food_nutritional_info.csv', encoding='cp949')

# 원하는 데이터로 간추리기
selected_data = data[['식품명', '식품대분류명', '대표식품명', '영양성분함량기준량', '에너지(kcal)', '탄수화물(g)', '단백질(g)', '지방(g)', '당류(g)']]
selected_data = selected_data.fillna(0)
print(selected_data)