Kaggle CC General Err
2024. 4. 22. 13:37ㆍ데이터 분석/에러
교재에 있는 정제된 csv 대신 원 데이터인 Kaggle에 있는 신용카드 데이터를 사용하고자 함
문제는 excel파일이고 한줄에 csv형태로 한줄에 다 들어가있는 점, xy가 반대로 들어가있는 점.
X = pd.read_excel('./CC GENERAL.xls')
ValueError: Excel file format cannot be determined, you must specify an engine manually.
1. 엔진을 지정 (!pip xlrd 이후 engine='xlrd' 추가해서 지정)
XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'CUST_ID,'
2. html형식으로 읽으면 된다고 해서 read_html() 사용
> 다 안되길래 어차피 모양도 csv랑 같으니 밑져야 본전 복사해서 확장자만 바꿔서 실행하니 잘 된다. (???)
728x90