关于《python数据分析与挖掘实战》书中的一个小错误

在第七章中,即航空数据关联规则分析的章节中,第二个代码进行情书清洗时,你会发现示例代码报错,代码如下:

 

#-*- coding: utf-8 -*-
#数据清洗,过滤掉不符合规则的数据

import pandas as pd

datafile= 'E:\\3data-mining\\2py-testing\\data and code\\chapter7\\demo\\data/air_data.csv' #航空原始数据,第一行为属性标签
cleanedfile = 'E:\\3data-mining\\output/data_cleaned.xls' #数据清洗后保存的文件

data = pd.read_csv(datafile,encoding='utf-8') #读取原始数据,指定UTF-8编码(需要用文本编辑器将数据装换为UTF-8编码)

data = data[data['SUM_YR_1'].notnull()*data['SUM_YR_2'].notnull()] #票价非空值才保留

#只保留票价非零的,或者平均折扣率与总飞行公里数同时为0的记录。
index1 = data['SUM_YR_1'] != 0
index2 = data['SUM_YR_2'] != 0
index3 = (data['SEG_KM_SUM'] == 0) & (data['avg_discount'] == 0) #该规则是“与”
data = data[index1 | index2 | index3] #该规则是“或”

data.to_excel(cleanedfile) #导出结果

在运行后会报错,错误提示为:No engine for filetype: 'csv'

因为这是数据输出的格式不应该为.csv,应该换成xls,这样就不会报错了。

 

datafile= 'E:\\3data-mining\\2py-testing\\data and code\\chapter7\\demo\\data/air_data.csv' #航空原始数据,第一行为属性标签
cleanedfile = 'E:\\3data-mining\\output/data_cleaned.xls' #数据清洗后保存的文件

这个警告是没关系的,这样之后数据便实现了清洗工作。

最后便正确了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python数据分析挖掘实战资源非常丰富。以下是一些主要的资源: 1. 书籍:市面上有很多优秀的Python数据分析挖掘的书籍,其中一本非常受欢迎的是《Python数据分析实战》,它从数据获取、数据清洗、特征工程到模型建立都有详细的介绍和实战案例。此外,还有《Python数据挖掘入门与实践》、《利用Python进行数据分析》等。 2. 在线教程:网上有很多提供Python数据分析挖掘的在线教程,例如Coursera上的"Python for Data Science"课程,Udemy上的"Data Analysis with Python and Pandas"课程等。这些教程都提供了视频教学和实践项目,便于学习和实践。 3. 视频教程:有许多优质的Python数据分析挖掘的视频教程,其中一些是由知名的数据分析师和专家录制的。例如,DataCamp网站提供了很多与Python数据分析相关的视频课程,如"Python Data Science Toolbox"等。 4. 开源项目和代码库:GitHub等开源平台上有很多开源的Python数据分析挖掘项目和代码库。例如,Pandas、NumPy等数据科学相关的Python库都是开源的,可以方便地用于数据处理和分析。此外,还有像scikit-learn、TensorFlow等机器学习库也可以用于数据挖掘和模型建立。 5. 数据竞赛平台:一些数据竞赛平台,如Kaggle和天池等,提供了许多真实的数据分析挖掘竞赛项目,可以通过参与这些竞赛来学习和实践Python数据分析挖掘的技能。 总之,对于学习Python数据分析挖掘,可以通过阅读相关书籍、参加在线教程、观看视频教程、使用开源项目和代码库以及参与数据竞赛平台等方式来获取实战资源。不断学习和实践是掌握这些技能的关键。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值