自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 python文本相似度计算

步骤分词、去停用词词袋模型向量化文本TF-IDF模型向量化文本LSI模型向量化文本计算相似度理论知识两篇中文文本,如何计算相似度?相似度是数学上的概念,自然语言肯定无法完成,所有要把文本转化为向量。两个向量计算相似度就很简单了,欧式距离、余弦相似度等等各种方法,只需要中学水平的数学知识。那么如何将文本表示成向量呢?词袋模型最简单的表示方法是词袋模型。把一篇文本想

2017-07-31 14:57:28 1024 1

转载 自然语言处理怎么最快入门?

首页发现话题登录加入知乎自然语言处理怎么最快入门?关注问题写回答自然语言处理自然语言处理怎么最快入门?最好是方法与教程关注者5651

2017-07-31 11:47:40 30792

转载 自然语言处理(简称NLP)

作者:微软亚洲研究院链接:https://www.zhihu.com/question/19895141/answer/149475410来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。自然语言处理(简称NLP),是研究计算机处理人类语言的一门技术,包括:1.句法语义分析:对于给定的句子,进行分词、词性标记、命名实体识别和链接、句法分析、语

2017-07-31 11:47:02 684

转载 语义分析的一些方法(一)

语义分析的一些方法(一)2015/02/04机器学习、自然语言处理、计算广告学vincentyao语义分析,本文指运用各种机器学习方法,挖掘与学习文本、图片等的深层次概念。wikipedia上的解释:In machine learning, semantic analysis of a corpus is the task of building structures that a

2017-07-27 17:53:48 524

转载 语义分析相关应用的实作要点

郑昀@玩聚RT 20090703舆情监测和口碑监测都属于一个路子。常有人问到自然语言处理技术在其中如何上手实用。下面简单说一下。一、词典和算法前期的主要问题是用于分词和分类的词典建立,根据你的应用不同,这一套词典(可能有很多词典,比如人名、地名、组织名、常用英文缩写)的侧重是不同的。还有停用词表,也就是“的”“啊”“哦”之类的词。举例:对于生活搜索,“鱼头王

2017-07-27 17:26:59 2878

转载 中文分词常见方法

作者:竹间智能 Emotibot链接:https://www.zhihu.com/question/19578687/answer/190569700来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。中文分词是中文文本处理的一个基础步骤,也是中文人机自然语言交互的基础模块。不同于英文的是,中文句子中没有词的界限,因此在进行中文自然语言处理时,通常

2017-07-25 12:32:06 13630

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除