Python ML环境搭建与学习资料推荐

原创 2017年08月10日 10:51:01

python

  1. 下载anconda
  2. 更新pip源
    参考文章一: Python类库三两事 - 一次解决:http://blog.csdn.net/FontThrone/article/details/76560698
    参考文章二:Anaconda多环境多版本python配置指导http://blog.csdn.net/fontthrone/article/details/76560293

IDE

  1. 下载pycharm专业版
  2. Pycharm建议激活方法使用(license server),注册码亦可,但是现在能用的注册码不好找

配置环境

1.创建新环境,并激活conda create -n MLEnv python=3.6.2

创建新环境

2.激活环境activate MLenv

激活环境

3.检查基础类库

# 建议的使用的命令,顺序如下
conda install pandas
conda install scipy
conda install matplotlib

直接使用pip 进行安装和更新scipy往往会安装失败,这是因为系统环境中缺乏其他基本组件造成的,conda安装(install)或者更新(upgrade)则会把需要的组件全都安装上,但是conda的版本更新往往滞后于pip.
4. 其他基本类库

# 其实机器学习需要的基本类库,除了第三部中给出的科学计算与可视化的基础类库外,就不在需要什么了
pip(conda) install scikit-learn
# 图像处理的基本库
pip(conda) install scikit-image

# 自然语言处理的基本库
pip install jieba
pip(conda) install nltk
# nltk下载之后需要下载其他东西

4.NLTK的问题
看图:
NLTK下载

如图,nltk在下载完毕之后,还需要下载其他资料和模型,才能发挥出真正完整的功能,如图所示,下载的地址在外网,而且大小有3.17g之巨,所以下载贼慢,我第一次下载下载了十几个小时,途中还经常断线,需要手动再重新下载某个单元组件,不然整个模块就会停止下载,好在第一次下载之后所有环境的NLTK都使用这一个文件夹里的内容,那么港道理,我直接把文件发给大家,大家应该也可以直接使用(事实上确实可以,我在其他电脑上搭建环境就是直接copy过去的)
百度云地址

学习资料

书籍

  1. 入门书籍个人比较推荐麦好的《机器学习实践指南第二版》,这本书的结构和花书很像,有基础,有各个部分介绍,但是还有代码,比较适合入门机器学习.读完这本书机器学习的整体把握包括数学基础,应用领域都可以有比较好的认识.但是本书中的很多代码虽然实现了功能,但是代码的专业程度似乎比不上《机器学习实战》,假如你想要自己实现机器学习算法的代码的话,后者可能是更好的选择.
  2. 理论方面首推西瓜书,也就是周志华教授的《机器学习》,二推李航教授的《统计学习方法》
  3. 在之前的几本书之后,你可能还需要一本书对数据科学的工程有更好地理解,这个时候建议《python机器学习及实践-从零开始通往kaggle之路》,当然也可以直接从这本书入门.或者《数据科学入门》也可能是一个不错的选择.
  4. 视频:人工智能研究网的教程还不错http://www.studyai.com/course/index/
  5. python科学计算与可视化的基础也很重要,尤其是科学计算,各个组件的官方文档已经非常适合入门,你完全可以通过官方文档入门,给出个国内的中文教学链接:http://old.sebug.net/paper/books/scipydoc/index.html
  6. scikitlearn是工程的利器一定要学会使用,可以直接通过官方文档或者源码注释学习,非常好用,也可以直接用 7 中的推荐,非常好
  7. 如果你想比较快速的入门机器学习工程,或者想进一步提升建议阅读《Python大战机器学习:数据科学家的一个小目标》,这本书很很适合初中期的学习
版权声明:转载请标明出处:http://blog.csdn.net/fontthrone

相关文章推荐

Python3 爬取百度瀑布流动态加载图片

百度图片的网页是一个动态页面,它的网页原始数据是没有图片的,通过运行 JavaScript ,把图片数据插入到网页的 html 标签里,所以在原始数据里是没有图片的,它只在运行时加载和渲染,得通过抓包...

Python2 Python3 爬取赶集网租房信息,带源码分析

*之前偶然看了某个腾讯公开课的视频,写的爬取赶集网的租房信息,这几天突然想起来,于是自己分析了一下赶集网的信息,然后自己写了一遍,写完又用用Python3重写了一遍.之中也遇见了少许的坑.记一下.算是...

第一天:NodeJs Windows环境搭建、学习资料地址、注意事项总结

Node.js安装包及源码下载地址为:http://www.nodejs.org/download/。 安装步骤: 步骤 1 : 双击下载后的安装包 node-v0.10.26-x86.msi,...

selenium+Python环境搭建

  • 2015-06-25 17:02
  • 15.01MB
  • 下载

(4)ODI环境搭建_初始化资料档案库(RCU)

如果是独立部署用于学习和测试目的,不需要部署代理的安装,可以直接使用ODI自带的功能生成主资料档案库和工作资料档案库。  如果是需要部署代理,强烈建议采用该步骤进行资料档案库的初始化,因为自己配...

linux下的python环境搭建

  • 2014-10-16 10:51
  • 20KB
  • 下载

史上最易懂的Android jni开发资料--NDK环境搭建

史上最易懂的Android jni开发资料–NDK环境搭建 谷歌改良了ndk的开发流程,对于Windows环境下NDK的开发,如果使用的NDK是r7之前的版本,必须要安装Cygwin才能使用NDK。而...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)