![](https://img-blog.csdnimg.cn/07cb5072b82b46c4863b337a27a3c9ea.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
《自然语言处理技术:Python实战》
文章平均质量分 54
自然语言处理
非文的NLP修炼笔记
研究生在读,NLP小白一枚,希望大家多多指教~
展开
-
《自然语言处理实战:利用Python理解、分析和生成文本》读书笔记:第1章 NLP概述
好的NLP可以帮助拯救世界原创 2022-08-09 16:52:06 · 921 阅读 · 0 评论 -
《自然语言处理技术:Python实战》学习笔记:第一章 初识自然语言处理技术(1.4)
1.4 自然语言处理初体验:Eliza在英国电脑科学家Alan Turing于1945年至1948年期间提出近代人工智能理论后,美国麻省理工学院人工智能实验室的德裔电脑科学家Joseph Weizenbaum则是在1964年至1966年期间打造史上第一个聊天机器人“Eliza”。“Eliza”是以MAD-SLIP程序语言编写,并且在36位元架构的IBM 7094大型电脑上运作,所有程序代码约在200行左右。执行过程中,“Eliza”会透过分析所输入文字内容,并且将特定字句重组,变成全新字句组合。原创 2022-01-02 09:06:39 · 474 阅读 · 0 评论 -
《自然语言处理技术:Python实战》第一章 初识自然语言处理技术(1.3)
1.3 基于GMM-HMM算法的语音识别准备数据集数据预处理导入第三方库from python_speech_features import mfccfrom scipy.io import wavfilefrom hmmlearn import hmmimport joblibimport numpy as npimport os定义 生成训练标签 函数# 生成wavdict,key=wavid,value=wavfiledef gen_wavlist(wavpat原创 2021-12-31 11:36:44 · 1571 阅读 · 0 评论 -
《自然语言处理技术:Python实战》学习笔记:第一章 初识自然语言处理技术(1.2.2)
1.2.2 Numpy的使用Numpy 简介Numpy ( Numerical Python 的简称)是高性能科学计算和数据分析的基础包,提供了矩阵运算的功能。 Numpy 提供了以下几个主要功能:ndarray :一个具有向量算术运算和复杂广播能力的多维数组对象; 用于对数组数据进行快速运算的标准数学函数; 用于读写磁盘数据的工具以及用于操作内存映射文件的工具; 非常有用的线性代数,傅里叶变换和随机数操作; 用于集成 C/C+ 和 Fortran 代码的工具。除明显的科学用途之外,原创 2021-12-31 10:50:00 · 492 阅读 · 0 评论 -
《自然语言处理技术:Python实战》学习笔记:第一章 初识自然语言处理技术(1.2.1)
1.2.1 正则表达式在NLP中的应用正则表达式简介正则表达式是一种定义了搜索模式的特征序列,主要是用于字符串的模式匹配,或是字符的匹配。随着计算机的普及以及互联网的发展,大量的信息以电子文档方式呈现在人们的面前。 NLP 通常所需要处理的语料一部分来自于 Web 网页的信息抽取,一部分来自于文本格式的文档。 Web 网页具有很强的开发价值,具有时效性强,信息量大,结构稳定,价值高等特点,文本格式的文档多来源于人为编写或系统生成,其中包含了非结构化文本、半结构化文本以及结构化文本。正则表达式的作原创 2021-12-31 10:13:12 · 654 阅读 · 0 评论 -
《自然语言处理技术:Python实战》学习笔记:第一章 初识自然语言处理技术(1.1.2)
1.1.2 自然语言处理相关知识的构成NLP 的基本术语1、分词( segment )词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记;因此,中文词语分析是中文分词的基础与关键。 中文和英文都存在分词的需求,不过相较而言,英文单词本来就有空格进行分割,所以处理起来相对方便。但是,由于中文是没有分隔符的,所以分词的问题就比较重要。分词常用的手段是基于字典的最长串匹配,据说可以解决85%的问题,但是歧义分词很难。原创 2021-12-31 09:47:40 · 679 阅读 · 0 评论 -
《自然语言处理技术:Python实战》学习笔记:第一章 初识自然语言处理技术(1.1.1)
第一章 初识自然语言处理技术1.1.1 走进自然语言处理自然语言处理( Natural Language Processing ,简称 NLP )是计算机科学领域以及人工智能领域的一个重要的研究方向,它研究用计算机来处理、理解以及运用人类语言(如中文、英文等),达到人与计算机之间进行有效通讯。在一般情况下,用户可能不熟悉机器语言,所以自然语言处理技术可以帮助这样的用户使用自然语言和机器交流。从建模的角度看,为了方便计算机处理,自然语言可以被定义为一组规则或符号的集合,我们组合集合中的符号来传递各原创 2021-12-31 09:15:49 · 450 阅读 · 0 评论