自然语言处理
zaishaoyi
如果学习不用来装逼,那将毫无意义~
展开
-
TF-IDF
一、基本概念TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数(TF)成正比增加,但同时会随着它在语料库中出现的频率成反比下降。TF-IDF加权的各种形式常被搜索引擎应用,作为文件与用户查询之间相关程度的度量。通过计算文档中字词的TF-IDF可以进行文章关键词的抽取。给定一批文档D , 文档个数为|D|, 第j个文档记为。对每篇文档进行切词,第i个词为,第i个词在第j个文档中出现次数为二、计算方式2.1 计算T原创 2020-07-21 16:01:27 · 444 阅读 · 0 评论 -
零基础入门NLP-实践笔记一
一、任务https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.6.6406111aIKCSLV&postId=118252任务说明:https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12586969.1002.6.6406111aIKCSLV&postId=118252二、今日目标理解赛题背景和赛题数据完成赛题报名和数据下载,理解赛题思路原创 2020-07-21 11:41:40 · 458 阅读 · 0 评论