NLP
童璐0
这个作者很懒,什么都没留下…
展开
-
TF-IDF原理及使用
一. 什么是TF-IDFTF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率). 是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。上述引...转载 2019-11-30 15:04:02 · 246 阅读 · 0 评论 -
NLP学习路线总结
[原文链接:]https://blog.csdn.net/asialee_bird/article/details/85702874#1%E3%80%81%E8%87%AA%E7%84%B6%E8%AF%AD%E8%A8%80%E5%A4%84%E7%90%86%E6%A6%82%E8%BF%B01、自然语言处理概述2、自然语言处理入门基础3、自然语言处理的主要技术范畴4、自然语言处理基本...转载 2019-10-16 23:06:10 · 688 阅读 · 0 评论 -
NLP的学习笔记(3)之Pandas库
Pandas是什么?Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。Pandas最特别的地方就是有标签列。利器之一:Series它是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的==数据标签(即索引)==组成。仅由一组数据也可产生简单的Series对象。利...原创 2019-10-13 22:29:41 · 285 阅读 · 0 评论 -
NLP的学习笔记(1)
初学NLP,先从定义概念上了解一下它吧。从研究内容和方法上来看,自然语言处理研究集认知科学、计算机科学、语言学、数学与逻辑学、心理学等多种学科于一身。一、定义近二三十年中,“自然语言处理”的研究得到了前所未有的重视,但是对其的定义仍没有一个确定唯一的答案,但是有多位专家学者给出了自己的见解:冯志伟学者在1996年出版的《自然语言的计算机处理》中定义到:自然语言处理就是利用计算机为工具对人...原创 2019-09-08 17:15:02 · 179 阅读 · 0 评论 -
NLP的学习笔记(2)
1.numpy是什么?一个开源的Python科学计算库。2.Python+numpy=MATLAB3.优点核心算法是C语言编写,执行效率高最基本数据的类型:ndarray(N-dimensional array) N维数组ndarray是由同质元素组成的多维数组NumPy的主要对象是同构多维数组。它是一个元素表(通常是数字),所有类型都相同,由非负整数元组索引。在NumPy维度中...原创 2019-09-23 08:16:42 · 138 阅读 · 0 评论