Python ML环境搭建与学习资料推荐

原创 2017年08月10日 10:51:01

python

  1. 下载anconda
  2. 更新pip源
    参考文章一: Python类库三两事 - 一次解决:http://blog.csdn.net/FontThrone/article/details/76560698
    参考文章二:Anaconda多环境多版本python配置指导http://blog.csdn.net/fontthrone/article/details/76560293

IDE

  1. 下载pycharm专业版
  2. Pycharm建议激活方法使用(license server),注册码亦可,但是现在能用的注册码不好找

配置环境

1.创建新环境,并激活conda create -n MLEnv python=3.6.2

创建新环境

2.激活环境activate MLenv

激活环境

3.检查基础类库

# 建议的使用的命令,顺序如下
conda install pandas
conda install scipy
conda install matplotlib

直接使用pip 进行安装和更新scipy往往会安装失败,这是因为系统环境中缺乏其他基本组件造成的,conda安装(install)或者更新(upgrade)则会把需要的组件全都安装上,但是conda的版本更新往往滞后于pip.
4. 其他基本类库

# 其实机器学习需要的基本类库,除了第三部中给出的科学计算与可视化的基础类库外,就不在需要什么了
pip(conda) install scikit-learn
# 图像处理的基本库
pip(conda) install scikit-image

# 自然语言处理的基本库
pip install jieba
pip(conda) install nltk
# nltk下载之后需要下载其他东西

4.NLTK的问题
看图:
NLTK下载

如图,nltk在下载完毕之后,还需要下载其他资料和模型,才能发挥出真正完整的功能,如图所示,下载的地址在外网,而且大小有3.17g之巨,所以下载贼慢,我第一次下载下载了十几个小时,途中还经常断线,需要手动再重新下载某个单元组件,不然整个模块就会停止下载,好在第一次下载之后所有环境的NLTK都使用这一个文件夹里的内容,那么港道理,我直接把文件发给大家,大家应该也可以直接使用(事实上确实可以,我在其他电脑上搭建环境就是直接copy过去的)
百度云地址

学习资料

书籍

  1. 入门书籍个人比较推荐麦好的《机器学习实践指南第二版》,这本书的结构和花书很像,有基础,有各个部分介绍,但是还有代码,比较适合入门机器学习.读完这本书机器学习的整体把握包括数学基础,应用领域都可以有比较好的认识.但是本书中的很多代码虽然实现了功能,但是代码的专业程度似乎比不上《机器学习实战》,假如你想要自己实现机器学习算法的代码的话,后者可能是更好的选择.
  2. 理论方面首推西瓜书,也就是周志华教授的《机器学习》,二推李航教授的《统计学习方法》
  3. 在之前的几本书之后,你可能还需要一本书对数据科学的工程有更好地理解,这个时候建议《python机器学习及实践-从零开始通往kaggle之路》,当然也可以直接从这本书入门.或者《数据科学入门》也可能是一个不错的选择.
  4. 视频:人工智能研究网的教程还不错http://www.studyai.com/course/index/
  5. python科学计算与可视化的基础也很重要,尤其是科学计算,各个组件的官方文档已经非常适合入门,你完全可以通过官方文档入门,给出个国内的中文教学链接:http://old.sebug.net/paper/books/scipydoc/index.html
  6. scikitlearn是工程的利器一定要学会使用,可以直接通过官方文档或者源码注释学习,非常好用,也可以直接用 7 中的推荐,非常好
  7. 如果你想比较快速的入门机器学习工程,或者想进一步提升建议阅读《Python大战机器学习:数据科学家的一个小目标》,这本书很很适合初中期的学习
版权声明:欢迎转载,共同学习,但请尊重版权,标明出处:http://blog.csdn.net/fontthrone

python 机器学习ML 相关

Deep learning:四十二(Denoise Autoencoder简单理解) http://www.cnblogs.com/tornadomeet/p/3261247.html   前...
  • brandohero
  • brandohero
  • 2014年10月10日 20:14
  • 1655

从零开始用python实现神经网络

http://www.wildml.com/2015/09/implementing-a-neural-network-from-scratch/ 浅显易懂~ Implementing a Neu...
  • lixintong1992
  • lixintong1992
  • 2016年04月10日 14:08
  • 3725

python版本及ML库

最近发现SciPy的最高版本是3.2,只能是退而求其次,不使用最新版本了!!!...
  • wishchin
  • wishchin
  • 2013年10月27日 21:10
  • 1357

Building ML Sys with Python源代码

  • 2015年08月07日 09:59
  • 88KB
  • 下载

Python2.7 ML开发各种所需软件包

  • 2015年05月08日 15:04
  • 12.04MB
  • 下载

Python学习之路——强力推荐的Python学习资料

资料一:程序媛想事儿(Alexia)总结 Python是一种面向对象、直译式计算机程序设计语言。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用縮进来定...
  • zhongwen7710
  • zhongwen7710
  • 2014年06月19日 23:03
  • 6056

caffe学习资料整理

徐气华的博客:http://www.cnblogs.com/denny402/p/5075490.html
  • mdjxy63
  • mdjxy63
  • 2017年07月16日 12:23
  • 145

【Python-ML】电影评论数据集文本挖掘 -在线学习

# -*- coding: utf-8 -*- ''' Created on 2018年1月22日 @author: Jason.F @summary: 文本挖掘,对电影评论进行内容抽取、特征向量化并...
  • fjssharpsword
  • fjssharpsword
  • 2018年01月22日 16:23
  • 85

最小二乘法python实现

最小二乘法回归参数梯度代码import pandas as pd import numpy as np df = pd.read_csv('https://archive.ics.uci.edu/ml...
  • TheOneAc1
  • TheOneAc1
  • 2017年09月16日 02:09
  • 153

隆重推荐【SQLServer】127个SQL server热门资料汇总(转)

最近有许多关于如何学习SQLSERVER的问题,其实新手入门的资源和贴子很多,现在向大家隆重推荐经过精心整理的【SQLServer】127个SQL server热门资料汇总 ,希望能对学习SQLSER...
  • tcs250
  • tcs250
  • 2013年03月15日 16:23
  • 2877
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Python ML环境搭建与学习资料推荐
举报原因:
原因补充:

(最多只允许输入30个字)