自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 资源 (2)
  • 收藏
  • 关注

原创 使用requests爬取数据中文编码问题

最近参加一个比赛,由于数据集较少,需要自己手动爬取一些数据。首先发现原网页是局部刷新页面的,通过分析,拿到了请求json字符串的url,将url直接复制在浏览器中,可以拿到json字符串,接下来码代码爬取数据,主要代码如下: response = requests.get(url) if response.status_code == 20...

2018-06-14 10:45:00 699

原创 RandomForestRegressor 评价方法

最近在参加一个比赛,用到了随机森林作回归,遇到了一个小问题: 我使用的是RadomForestRegressor()类进行回归预测,评价指标使用了metrics.roc_auc_score(),之后就报错了: ValueError: continuous is not supported 意思是该方法不支持连续值,之后查了一下,可能是因为将分类的评价...

2018-06-04 15:47:00 2857

WordCountMapReduce.zip

内容为MapReduce的一些代码实践,包括: 1 自定义的FileInputFormat的实现代码; 2 自定义的Partition分区示例代码; 3 自定义的排序代码实例。

2020-05-24

python机器学习实战

机器学习实战》主要介绍机器学习基础,以及如何利用算法进行分类,并逐步介绍了多种经典的监督学习算法,如k近邻算法、朴素贝叶斯算法、Logistic回归算法、支持向量机、AdaBoost集成方法、基于树的回归算法和分类回归树(CART)算法等。第三部分则重点介绍无监督学习及其一些主要算法:k均值聚类算法、Apriori算法、FP-Growth算法。第四部分介绍了机器学习算法的一些附属工具。

2017-09-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除