Python数据挖掘入门与实践-Chapter3

最新推荐文章于 2022-01-07 15:57:29 发布

qq_41021500

最新推荐文章于 2022-01-07 15:57:29 发布

阅读量183

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41021500/article/details/102077321

版权

用决策树预测获胜球队

import pandas as pd 
dataset = pd.read_csv(data_filename)
dataset.ix[:5] # dataset.loc[:5] / dataset.iloc[:5]替代了dataset.ix[:5]

原文：

dataset = pd.read_csv(data_filename, parse_dates=[“Date”],skiprows=[0,])

提示报错
修改为

results = pd.read_csv(data_filename, parse_dates=["Date"])
#skiprows : list-like or integer, default None
#需要忽略的行数（从文件开始处算起），或需要跳过的行号列表（从0开始）

决策树中的参数

min_samples_split : 控制决策节点的创建
min_samples_leaf ：决策节点能否被保留
创建决策的标准：基尼不存度(Gini impurity) 和信息增益(Information gain)

standings = pd.read_csv(standings_filename,encoding=“unicode_escape”)代替pd.read_csv(standings_filename, skiprows=[0,1])

这个unicode_escape是什么？将unicode的内存编码值进行存储，读取文件时在反向转换回来。这里就采用了unicode-escape的方式

from sklearn.model_selection import GridSearchCV 替代了 from sklearn.grid_search import GridSearchCV

GridSearchCV用于系统地遍历模型的多种参数组合，通过交叉验证确定最佳参数

best_score_ : 最佳模型下的分数
best_params_ : 最佳模型参数
cv_results_ 具体用法 : 模型不同参数下交叉验证的结果
best_estimator_ : 最佳分类器

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Python数据挖掘入门与实践-Chapter3

用决策树预测获胜球队import pandas as pd dataset = pd.read_csv(data_filename)dataset.ix[:5] # dataset.loc[:5] / dataset.iloc[:5]替代了dataset.ix[:5]原文：dataset = pd.read_csv(data_filename, parse_dates=[“Date”...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。