![](https://img-blog.csdnimg.cn/e8bfd2cb840b40cf8df7f828e9b5100c.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
NLP自然语言处理——学习专栏
文章平均质量分 79
从头开始,深入简出讲解NLP的各个知识点,【理论+实战】一站式攻克NLP知识点
Yale曼陀罗
用数字剥开俗世的纷繁外衣~坚持做精品知识专栏的公益传播者,尊重知识积累、共享学术成果~
展开
-
Penn Treebank数据集介绍+句法分析parsed的基本语法+句法分析基础知识+NLP常用公开数据集汇总及下载
Penn Treebank是NLP中常用的PTB语料库,Penn Treebank是一个项目的名称,该项目对语料进行标注,标注内容包括:【词性标注】和【句法分析】。语料来源:1989年的华尔街日报语料规模:1M words,共2499片文章语料价格:1500~1700$tokenizing(分词)tagging(词性标注)chunking(分块)parsing(句法分析)"""treebank示例目录中包含的文件,分别为raw,tagged, parsed,combined。原创 2022-10-24 16:27:05 · 2195 阅读 · 0 评论 -
NLTK语料库nltk.download()安装失败及下载很慢的解决方法
使用NLTK.download()时出现的问题nltk_data数据下载链接:https://gitee.com/qwererer2/nltk_data/tree/gh-pages/原创 2022-10-14 16:51:28 · 992 阅读 · 0 评论 -
numpy的广播机制的计算原理详解
之所以说这种复制是“轻量级”的,是因为广播机制仅仅在逻辑上改变了张量的尺寸,只待实际需要时才真正实现张量的赋值和扩展。这种优化流程节省了大量计算资源,并由计算框架(如NumPy)隐式完成,用户无须关心实现细节。(例如:两个数组的加、减、乘、除等运算) ,而不是矩阵乘法的运算。,就是张量自动扩展,它是一种轻量级的张量复制手段。3. 广播(broadcast)运算的计算规则。1. 广播(broadcast)运算的前提。2. 广播(broadcast)运算的定义。(element-wise)的。原创 2022-09-23 16:34:55 · 710 阅读 · 0 评论 -
自然语言处理——基础篇01
自然语言处理(Natural Language Processing,NLP):是用计算机来理解和生成自然语言的各种理论和方法。自然语言:指的是人类语言,特指文本符号,而非语音信号。自然语言处理的代表性应用:机器翻译、智能助手、文本校对、舆情分析、智能教育、知识图谱。自然语言处理属于认知智能任务:认知智能是人类与动物的主要区别之一,它需要更强的抽象和推理能力。原创 2022-09-16 19:45:10 · 755 阅读 · 0 评论 -
NLP之【点互信息PMI】——衡量两变量之间的相关性
M = M / expected # Silence distracting warnings about log(0): with np . errstate(divide = 'ignore') : # np.errstate()用于浮点错误处理的上下文管理器。M = np . log(M) M [ np . isinf(M) ] = 0.0 # log(0)=0 # np.isinf()用于按元素测试正无穷或负无穷 if positive : M [ M < 0 ] = 0.0 return M。原创 2022-09-27 16:44:30 · 1766 阅读 · 0 评论