![](https://img-blog.csdnimg.cn/20201014180756923.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
文章平均质量分 79
Cherrie3
这个作者很懒,什么都没留下…
展开
-
拉勾网职位数据爬取与分析(一)
写在前面:开始数据挖掘的学习已有一段时间,由于研究生阶段一直使用C++,代码的熟练度还远远不够,对算法的理解也不够深刻。因此,想要写点东西记录自己学习的过程,希望可以在积累中不断提升自己。今天写一写最近几天爬取分析拉勾网岗位数据的过程,用到了python数据整理常用的pandas库、可视化操作的matplotlib和seaborn库、爬虫算法常用框架scrapy。原创 2016-09-23 22:30:00 · 6894 阅读 · 1 评论 -
推荐系统实践学习笔记(一)
写在前面:这几天学习了一下《推荐系统实践》这本书,出于兼顾学生读者和工程师读者的考虑,作者在理论上讲得不算太深,但是非常系统、全面。由于看得比较快,其中的方法没有来得及一一实现,打算写几篇博客记录一下,便于日后有空时翻看实践。原创 2016-10-02 21:26:40 · 4358 阅读 · 0 评论 -
推荐系统实践学习笔记(二):代码实现
写在前面:今天基于Movielens数据集把《推荐系统实践》上的部分算法实现了一下,顺便巩固python和pandas库的使用,发现书本上的代码有很多不靠谱之处(也许是我水平不够),所以基本都是自己写的,不当之处,还望指正。原创 2016-10-08 15:33:39 · 7515 阅读 · 4 评论