- 博客(4)
- 资源 (3)
- 问答 (2)
- 收藏
- 关注
原创 【Python】爬虫爬取各大网站新闻(一)
作者博客地址:http://andyheart.mePython爬虫一步一步爬取文章背景最近在学习机器学习算法,分为回归,分类,聚类等,在学习过程中苦于没有数据做练习,就想爬取一下国内各大网站的新闻,通过训练,然后对以后的新闻做一个分类预测。在这样的背景之下,就开始了我的爬虫之路。网站分析国内各大新闻网站汇总(未完待续):搜狐新闻:时政:http://m.sohu.com/cr/32/?page=2
2016-03-27 10:06:07 56194 19
原创 【机器学习】感知机学习---《统计学习方法》学习笔记
开始学习机器学习有一段时间了,一开始认为做应用的只知道简单的理论就够了,因此更加倾向于学习《机器学习实战》、《集体智慧编程》这类书籍,在学习了一段时间后,尤其是看了一段时间斯坦福大学的公开课以后,有一种强烈的欲望想要去学习机器学习中的数学,但是迫于自身数学能力不是很强,啃起《统计学习方法》这本书来,还是有一定难度的。只作为一个笔记,以后可以温故而知新。 在真正开始学习之前,其实统计学习方法中还是
2016-03-25 19:43:08 2214 2
原创 集体智慧编程(二)发现群组
博客地址:http://andyheart.me,首先会更新本人自己的博客,然后更新CSDN。有错误之处,请私信或者评论,多谢。概念数据聚类:一种用以寻找紧密相关的事、人或观点,并将其可视化的方法。目的是采集数据,然后从中找出不同的群组。 监督学习:利用样本输入和期望输出来学习如何预测的技术。例如,神经网络,决策树,支持向量机,贝叶斯过滤。 无监督学习:在一组数据中找寻某种结构,数据本身不是我们
2016-03-12 22:16:05 2080
原创 集体智慧编程(四)优化
本章主要介绍了几种常用的优化算法,优化技术擅长处理:受多种变量影响,存在多种可能解的问题。优化算法的关键在于找到成本函数。涉及到的算法如下: 随机搜索 爬山法(随机重复爬山法) 模拟退火算法 遗传算法 组团旅游本章从一个组团旅游的问题引出。描述:来自美国各地的家庭成员要在同一天乘坐飞机到达同一个地方,并且在同一天离开,设计一个合理的方案。分析:在实现过程中,首先应该知道成员名称以及对应的地点;其次应
2016-03-12 22:12:08 1120
新闻推荐系统中的推荐算法
2015-08-10
关于域控服务器的远程登录问题
2015-04-25
TA创建的收藏夹 TA关注的收藏夹
TA关注的人