常用工具包-nltk初步学习

本文介绍了nltk工具包的安装及实践理解,包括分词、词性标注、句法分析、加载语料库、概率统计、聚类器(如KMeans、gacc和混合高斯聚类)和分类器的使用。通过实例展示了如何使用nltk进行自然语言处理,适合初学者入门。
摘要由CSDN通过智能技术生成

         

目录

一、软件安装... 1

二、相关实践理解... 1

2.1分词、词性标注... 2

2.2句法、语义分析... 2

2.3加载语料库... 2

2.4概率统计... 3

2.4.1 FreqDist. 3

2.5聚类器... 4

2.5.1kmeans聚类... 4

2.5.2gaac聚类... 4

2.5.3混合高斯聚类... 5

2.6分类器... 6

三、结语... 6

 

         最小在学习nltk软件包,在此作简单梳理。

         学习教程《用Python进行自然语言处理(中文)》,此教程用的nltk、python都为旧版本的,所以在实践过程还结合网上资料来解决一些问题。

一、软件安装

         相关环境:win764系统,python3.3.2

         首先,于官网下载nltk:https://pypi.python.org/pypi/nltk。win7下可直接下载编辑好的自动安装包nltk-3.2.1.win32.exe,双击可安装。其次,还要下载一些数据文件:

         import  nltk

       

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值