初识Spacy

之所以想接触Spacy,是看到其自称为工业级的应用,所以想尝试下
windows下安装Spacy:
    直接安装 pip install spacy是会报错的
    解决方法:
    到  http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载spacy及其相关的包,挨个安装,最后安装spacy即可
          985935-20170911170704703-679520830.png
            安装成功:
           985935-20170911170705078-1040582026.png
  下载常用的模型
           与nltk类似,spacy也需要下载一些常用的包或是模型之类的东西
python -m spacy download enpython -m spacy download depython -m spacy download fr
python -m spacy download en_core_web_md

基础功能的测试:
    1. 断词与断句
     985935-20170911170705297-425784800.png
      985935-20170911170705578-298999899.png
      985935-20170911170705828-627641571.png
    2. 词干化(Lemmatize)
     985935-20170911170705985-1449975920.png
      985935-20170911170706125-1867506918.png
 
    3.标注词性(POS Tagging)
     985935-20170911170706282-1044123504.png
      985935-20170911170706422-1997896021.png
 
    4.命名实体识别(NER)
     985935-20170911170706547-162179563.png
     985935-20170911170706672-1986999631.png
    5.名词短语提取
     985935-20170911170706907-547209335.png
     985935-20170911170707078-185448167.png
    6. 基于词向量计算词间相似度
     985935-20170911170707203-1134922800.png
      985935-20170911170707766-2123262148.png
     985935-20170911170707907-1327948780.png
Spacy与中文:
    spacy对中文的支持调用的是jieba的接口,所以需要预先安装jieba,在调用时,使用
 
       
  1. nlp=spacy.load('zh')
   后面的操作与英文的类似
   但是只有断词还能用,其他功能需要有依赖的包库,所以,还不如直接用jieba来得直接

 

 

 

 









































 




转载于:https://www.cnblogs.com/combfish/p/7505851.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值