如何下载Python的机器学习包

如何下载Python的机器学习-自然语义处理包NLTK

 

1、打开Ptyhon命令行

2、下载nltk

pip install nltk

3、允许nltk下载器

import nltk

nltk.download()

4、在下载器界面里,选择“all”,下载全部文件

5、因为下载国外网站的大文件很慢,也可以设置代理服务器

>>> nltk.set_proxy('http://proxy.example.com:3128', ('USERNAME', 'PASSWORD'))

>>> nltk.download()

 

 

手动安装

前面的方法,安装起来慢、又容易出现问,所以也可以手动安装。

 

1、创建一个文件夹nltk_data,比如C:\nltk_data,或 or /usr/local/share/nltk_data,

2、在这个文件夹下,创建子目录:chunkers, grammars, misc, sentiment, taggers, corpora, help, models, stemmers, tokenizers

3、在http://nltk.org/nltk_data/ 下分开下载包(可以参考download链接)

把这些包解压缩到对应的子目录。

比如,https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/packages/corpora/brown.zip 文件被解压到nltk_data/corpora/brown .

4、设置电脑环境变量NLTK_DATA ,指向nltk_data文件夹。

或者,通过命令 from nltk.book import *,来查nltk_data路径在哪儿。

5、也可以从网盘下载。目前网友贡献了2个网盘。要下载大的那个。

网盘是2019年5月30日最后更新,基本够了;因为这个nltk_data语料库大不符都是好几年前的,最新更改的也是一年多前的。

第一个:链接:https://pan.baidu.com/s/1iJGCrz4fW3uYpuquB5jbew 提取码:o5ea

第二个: 链接:https://pan.baidu.com/s/1ekdZl1ows34n02mMGLx9jA 密码:zn68

6、通过nltk.download()打开下载器,看看里面红色的包还多不多。

如果有,多点几次刷新;然后再单选依然红色的包,再逐个选择下载。

可以反复重启、下载。

之所以不大好安装nltk_data,主要是跨国下载,网速太慢。

 

 

 

遇到下载错位怎么办——Error 11004,链接不了服务器

 

1、如果遇到 [Error 11004]getaddrinfo failed,那是链接不了服务器

是“找不到 raw.githubusercontent.com 的服务器 IP 地址”的错误。

 

2、可以改变电脑系统的ip映射

3、在C:\Windows\System32\drivers\etc 路径下找到hosts文件,并在最后添加 199.232.68.133 raw.githubusercontent.com IP地址,并保存。这时再打开NLTK下载器,便可以正常打开。

4、如果raw.GitHub的IP地址更换得比较频繁,那么先查询该网址的IP地址后再修改hosts文件。打开查询IP地址的网址:https://www.ipaddress.com/

输入如下代码,按Enter:raw.githubusercontent.com

 

在下载器里,遇到下载out off date怎么办?

 

1、All packages页签里,点击单个包,重新下载

2、到https://github.com/nltk/nltk_data,下载

如果是全部包一起下载,就要放命名为nltk_data,放在以下任一路径:

/usr/lib

/usr/local/lib

安装完以后,测试NTLK是否下载成功

 

测试输出NTLK布朗文本语料库前十个单词:

>>> from nltk.corpus import brown

>>> brown.words()

['The', 'Fulton', 'County', 'Grand', 'Jury', 'said', ...]

 

 

安装NTLK中文包

 

1、下载:python -m spacy download zh_core_web_sm

2、测试是否安装成功:

import spacy

nlp = spacy.load("zh_core_web_sm")

doc = nlp("No text available yet")

print([(w.text, w.pos_) for w in doc])

 

 

 

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Python机器学习,首先推荐Python官方文档,其次推荐Coursera(吴恩达老师的课程)以及Udacity(Sebastian Thrun教授的课程),此外还有Scikit-Learn,TensorFlow和Keras等机器学习框架的官方文档,这些教程都是非常有价值的资源,能够让您从基础的机器学习算法开始,学习到深度学习相关的知识。此外还有一些推荐的高质量博客,如Sebastian Raschka博士的Blog,以及Kaggle上的Notebook,其中含了很多实战的例子以及完整的解释。最后,还可以通过阅读实现机器学习方面的优秀开源代码库,如Google’s Machine Learning Playground、 Kaggle Kernels以及Github上的开源项目,不仅能够深入理解机器学习算法的实现过程,也可以通过模仿这些开源项目开发自己的机器学习应用。总之,机器学习是一个非常庞杂和深奥的领域,需要学习者持续的投入和实践才能够真正理解,融会贯通,希望这些资源可以帮助大家更轻松地入门Python机器学习,进而在这个领域里面能够开发出更加优秀、稳健、高效的算法和应用。 ### 回答2: Python机器学习学习资料丰富多样。首先,Python是一个流行的编程语言,它为机器学习提供了大量的库和工具。以下是几个值得参考的学习资源: 1. Scikit-learn:Scikit-learn是一个流行的Python机器学习库,提供各种算法,如分类、回归、聚类等。 2. TensorFlow:TensorFlow是由Google开发的深度学习框架,提供了丰富的机器学习模型,如卷积神经网络、循环神经网络等。 3. Coursera:Coursera是一家在线教育平台,提供了众多关于机器学习的课程,括由斯坦福大学Andrew Ng教授领导的著名课程。 4. Kaggle:Kaggle是一个著名的机器学习竞赛平台,提供了许多有趣的数据挖掘竞赛,可以积极参与并学习实践。 5. Python机器学习Python Machine Learning)书籍:该书详细介绍了Python机器学习的基础知识和实践技巧,括数据预处理、分类算法、聚类算法等,深入浅出,适合初学者。 总之,Python机器学习学习资料丰富多样,可以根据自己的需求和兴趣进行选择,通过实践和学习不断提高自己的机器学习技能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值