Kaggle CC General Err

2024. 4. 22. 13:37데이터 분석/에러

교재에 있는 정제된 csv 대신 원 데이터인 Kaggle에 있는 신용카드 데이터를 사용하고자 함

문제는 excel파일이고 한줄에 csv형태로 한줄에 다 들어가있는 점, xy가 반대로 들어가있는 점.

 

X = pd.read_excel('./CC GENERAL.xls')
ValueError: Excel file format cannot be determined, you must specify an engine manually.

1. 엔진을 지정 (!pip xlrd 이후 engine='xlrd' 추가해서 지정)

 

 

XLRDError: Unsupported format, or corrupt file: Expected BOF record; found b'CUST_ID,'

2. html형식으로 읽으면 된다고 해서 read_html() 사용

 

> 다 안되길래 어차피 모양도 csv랑 같으니 밑져야 본전 복사해서 확장자만 바꿔서 실행하니 잘 된다. (???)

728x90