基于python的语料库数据处理电子版_[异步图书].精通Python自然语言处理[PDF][16.04MB]...

本书是一本关于自然语言处理的综合学习指南,详细介绍了使用Python实现NLP任务,包括字符串操作、统计语言建模、词性标注、语法解析、语义分析、情感分析、信息检索、语篇分析和系统评估等多个主题,适合熟悉Python的读者参考学习。
摘要由CSDN通过智能技术生成

内容简介

自然语言处理是计算语言学和人工智能之中与人机交互相关的领域之一。 本书是学习自然语言处理的一本综合学习指南,介绍了如何用Python实现各种NLP任务,以帮助读者创建基于真实生活应用的项目。全书共10章,分别涉及字符串操作、统计语言建模、形态学、词性标注、语法解析、语义分析、情感分析、信息检索、语篇分析和NLP系统评估等主题。 本书适合熟悉Python语言并对自然语言处理开发有一定了解和兴趣的读者阅读参考。

目录

第1章 字符串操作1

1.1 切分1

1.1.1 将文本切分为语句2

1.1.2 其他语言文本的切分2

1.1.3 将句子切分为单词3

1.1.4 使用TreebankWordTokenizer

执行切分4

1.1.5 使用正则表达式实现

切分5

1.2 标准化8

1.2.1 消除标点符号8

1.2.2 文本的大小写转换9

1.2.3 处理停止词9

1.2.4 计算英语中的停止词10

1.3 替换和校正标识符11

1.3.1 使用正则表达式替换

单词11

1.3.2 用另一个文本替换文本的

示例12

1.3.3 在执行切分前先执行替换操作12

1.3.4 处理重复字符13

1.3.5 去除重复字符的示例13

1.3.6 用单词的同义词替换14

1.3.7 用单词的同义词替换的

示例15

1.4 在文本上应用Zipf定律15

1.5 相似性度量16

1.5.1 使用编辑距离算法执行相似性度量16

1.5.2 使用Jaccard系数执行相似性度量18

1.5.3 使用Smith Waterman距离算法执行相似性度量19

1.5.4 其他字符串相似性度量19

1.6 小

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值