![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
自然语言处理
文章平均质量分 84
小杨算法屋
这个作者很懒,什么都没留下…
展开
-
论文-Explainable Recommendation for Repeat Consumption
论文来自于:RecSys 2020摘要:对推荐item显示适当的解释对于提高推荐系统的说服力和用户满意度至关重要,尽管用户经常在音乐和餐馆重复消费相同的物品,但是现有的研究主要集中在为推荐新item提供解释上。在本文中,我们描述了对重复消费item的可解释推荐的概念。由于在音乐当中重复消费的比例很高,我们根据个人、社会和item三个因素对歌曲推荐提出了九种解释。实验选择了622名参与者,从在线的调查结果中评估了这些解释的有效性。关键字:可解释推荐、重复消费、用户研究1、介绍为了提高推原创 2021-10-10 16:28:22 · 265 阅读 · 0 评论 -
Word2vec训练中文词向量
Word2vec训练中文词向量将所有的语料读入到列表中,把每一句已经分好词的句子作为列表中的一个元素,类似:[[‘i’,’am’,’a’,’girl’],[‘he’,’is’,’a’,’boy’]]from gensim.models import Word2Vecimport osimport sys##下面的代码是训练字向量的代码sentence = []w...原创 2018-08-16 10:55:19 · 5154 阅读 · 2 评论 -
gensim中word2vec训练向量
当我们训练神经网络时,输入数据有时是训练好的词向量,有时是字向量,我们自己训练训练向量时,可以借用gensim中的word2vec,下面的代码可以同时实现词向量、字向量的训练from gensim.models import Word2Vecimport osimport jiebadef h1():##该函数主要是对语料的前期处理,可以根据不同的情况进行修改 path1 =...原创 2018-09-04 15:53:13 · 1992 阅读 · 1 评论 -
语言模型
语言模型定义语言模型是用来计算一个句子的概率的模型,也就是判断一句话是否合理的概率N-gram模型是一种基于统计的语言模型基于统计概率,计算一个句子的概率大小概率的公式为: 当概率值越大,则说明句子越合理,概率小,则说明不合理上面的公式不能直接进行计算,...原创 2019-12-30 19:11:33 · 1001 阅读 · 0 评论 -
TextBlob简介
TextBlob是一个用python编写的开源的文本处理库,它可以用来执行很多自然语言处理的任务,比如,词性标注、名词性成分提取、情感分析、文本翻译等等git 网址:https://github.com/sloria/TextBlob官方文档:https://textblob.readthedocs.io/en/dev/安装:pip install textblob貌似是针对英文进...原创 2018-12-24 15:03:58 · 16900 阅读 · 6 评论 -
北大新开源的分词工具pkuseg
北京大学新开源了一个中文的分词工具包,即pkuseg,相比于现在已有的开源工具,pkuseg大幅度的提升了分词的准确率。它在多个分词数据集上都有非常高的分词准确率,我们所知道的,也经常使用的结巴分词误差率高达 18.55% 和 20.42,而北大的 pkuseg 只有 3.25% 与 4.32%。github地址为:https://github.com/lancopku/PKUSeg-pyth...原创 2019-01-15 17:12:30 · 4817 阅读 · 1 评论 -
FastText的简单介绍
0、引言FastText是facebook开源的一款集word2vec、文本分类等一体的机器学习训练工具。在之前的论文中,作者用FastText和char-CNN、deepCNN等主流的深度学习框架,在同样的公开数据集上进行对比测试,在保证准确率稳定的情况下,FastText在训练时间上,有着惊人的表现,近百倍的速度提升1、fastText文本分类一般情况下,使用fastText进行文...原创 2019-01-25 14:22:42 · 24581 阅读 · 2 评论