NLP
NLProokie
这个作者很懒,什么都没留下…
展开
-
PageRank 算法
1. 算法来源谷歌的两位创始人,当时还是美国斯坦福大学 (Stanford University) 研究生的佩奇 (Larry Page) 和布林 (Sergey Brin) 开始了对网页排序问题的研究。他们的借鉴了学术界评判学术论文重要性的通用方法, 那就是看论文的引用次数。由此想到网页的重要性也可以根据这种方法来评价。于是PageRank的核心思想就诞生了2,非常简单:如果一个网页被很多其他网页链接到的话说明这个网页比较重要,也就是PageRank值会相对较高 如果一个PageRank值.转载 2020-12-15 19:40:26 · 1343 阅读 · 0 评论 -
NLP(二)(问答系统搭建(2)分词)
分词的实现分词(word segmentation)根据输入的文本,如何进行分词呢?当然可以调用一些常用的分词工具包,例如:Jieba分词 https://github.com/fxsjy/jiebaSnowNLP https://github.com/isnowfy/snownlpLTP http://www.ltp-cloud.com/HanNLP https://github.c...原创 2020-04-10 11:55:45 · 806 阅读 · 1 评论 -
NLP(二)(问答系统搭建(1))
什么是问答系统?问答系统是用户提出一个问题,系统匹配用户这个问题相似度最高的问题给出答案;类似于淘宝购物的机器人客服自动回复系统。问答系统搭建的思路接下来用一个案例来说明问答系统搭建的思路首先我们得准备数据, 那么问答系统的数据是什么呢? 就是我们需要提供一个语料库,这里边存在这常见问题的答案(一对一的形式)这里我引用一个培训机构的客服系统的语料库来演示:如何根据这个语料库匹配问...原创 2020-04-08 22:12:10 · 2313 阅读 · 0 评论 -
自然语言处理(NLP)基础部分(一)
自然语言处理(NLP)基础部分(一)什么是NLP?自然语言是指汉语、英语、法语等人们日常使用的语言,是自然而然的随着人类社会发 展演变而来的语言,而不是人造的语言,它是人类学习生活的重要工具。概括说来,自然语 言是指人类社会约定俗成的,区别于人工语言,如程序设计的语言。NLP=NLU+NLGNLU(natural language understanding):自然语言理解,...原创 2020-04-04 00:27:53 · 2940 阅读 · 0 评论