Python机器学习相关Demo
文章平均质量分 95
Python机器学习相关Demo
带着希望活下去
这个作者很懒,什么都没留下…
展开
-
【推荐系统实践】基于用户的协同过滤算法(UserCF)的python实现
1.数据集MovieLensMovieLens数据集包含多个用户对多部电影的评级数据,也包括电影元数据信息和用户属性信息。这个数据集经常用来做推荐系统,机器学习算法的测试数据集。尤其在推荐系统领域.数据集的下载地址为:数据集,有好几种版本,对应不同数据量,本文所用的数据为ml-latest-small.zip。本文主要使用其中ratings.csv、movies.csv两个数据表:ratin...原创 2021-08-18 15:29:39 · 1047 阅读 · 1 评论 -
python爬虫--豆瓣
查看相关的爬虫协议:部分网站都会给出robots.txt 写有相关爬虫说明注意:在爬虫时候,通过requests.get()得到不正确的状态码:4**:表示出错403问题:服务器已经理解请求,但是拒绝执行它418问题:网站的反爬程序返回的其他HTTP状态码查找可以参考:[异常状态码查看](https://baike.baidu.com/item/HTTP%E7%8A%B6%E6%80%81%E7%A0%81/5-053660?fr=aladdin#4_19)用Requests库的ge原创 2020-06-15 23:12:29 · 162 阅读 · 0 评论 -
python绘制precision-recall曲线、ROC曲线
基础知识TP(True Positive):指正确分类的正样本数,即预测为正样本,实际也是正样本。FP(False Positive):指被错误的标记为正样本的负样本数,即实际为负样本而被预测为正样本,所以是False。TN(True Negative):指正确分类的负样本数,即预测为负样本,实际也是负样本。FN(False Negative):指被错误的标记为负样本的正样本数,即实际为正样本而被预测为负样本,所以是False。TP+FP+TN+FN:样本总数。TP+FN:实际正样本数。TP+转载 2020-06-07 23:15:19 · 2605 阅读 · 0 评论