pip 加速:
下载:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple 包名
更新:
pip install –upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple 包名
数据挖掘知识、自然语言处理资料
- 机器学习算法代码
- 数据挖掘工具包
- LeftNotEasy - Wangda Tan个人博客
- python与R在一些方法上面的对比
- 用python进行文本挖掘(不错)
- 统计学习方法
- 个人博客
- 机器学习/深度学习/自然语言处理学习路线
- 码农场-自然语言 推荐阅读!!!
关联规则学习
PyMining:主要针对中文的数据挖掘工具
- 参考一
- 参考二,主要对第一版PyMining的介绍
- 参考三 主要是对Pyminig的介绍,这个人的博客日志里面也有对第二版的PyMing的介绍
- 参考二,主要对第二版PyMining的介绍
- 代码参考,可以在线浏览,因为没有积分,无法下载
SVM学习
- 参考一,里面包含一些数据集,例如mushroom.dat
使用spark对文本分词统计
- 点击见喜
文本分类
- 朴素贝叶斯文本分类
随机森林
- 点击有惊喜
数学编辑器在线
HDFS
JDBC
数据挖掘竞赛
- Kaggle
网站
Kaggle网站的登录问题解决
在国内需要翻墙,推进大家翻墙软件:
lantern-installer-beta.exe下载,开启之后,就可以进入验证码验证阶段,进行人机验证之后,就可以成功激活用户,就可以登录了。
[2015年Kaggle机器学习竞赛冠军以及优胜者的源代码汇总](http://blog.csdn.net/qq_26898461/article/details/49275401)
[Kaggle入门一](https://zhuanlan.zhihu.com/p/25686876?group_id=825076321293058048)
Data Castle