自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

江西师范大学-20届-吴悠

机器学习、大数据技术、深度学习、爬虫、web开发、区块链、ACM都瞎搞

  • 博客(20)
  • 资源 (5)
  • 收藏
  • 关注

原创 语言模型性能评价

2019-08-27 19:38:19 215

原创 语言模型及n元语法

语言模型(language model, LM)在自然语言处理中占有重要的地位,尤其在基于统计模型的语音识别、机器翻译、汉语自动分词和句法分析等相关研究中得到了广泛应用。目前主要采用的是n元语法模型(n-gram model),这种模型构建简单、直接,但同时也因为数据缺乏而必须采取平滑(smoothing)算法。...

2019-08-26 20:17:36 380

原创 语料库与语言知识库

语料库技术语料库(corpus base)就是存放语言材料的数据库。那么,顾名思义,语料库语言学(corpus linguistics)就是基于语料库进行语言学研究的一门学问。具体一点讲,语料库语言学是研究自然语言机读文本(或称“电子文本”)的采集、存储、标注、检索、统计等方法的一门学问,其目的是通过对客观存在的大规模真实文本中的语言事实进行定量分析,为语言学研究或自然语言处理系统开发提供支持...

2019-08-22 20:50:31 1656

原创 自动机在自然语言处理中的应用

单词拼写检查K.Oflazer曾将有限自动机用于英语单词的拼写检查[Oflazer,1996]。在该方法中,两个相似字符串之间的编辑距离采用Damerau给出的定义,即两个字符串之间的编辑距离等于使一个字符串变成另外一个字符串而进行的插入、删除、替换或相邻字符交换位置而进行操作的最少次数[Damerau,1964]。例如:单词形态分析词性消歧...

2019-08-20 19:31:12 583

原创 形式语言和自动机

字符串连接次方幂闭包运算形式语法的类型正则文法上下文无关文法上下文有关文法无约束文法

2019-08-19 19:50:51 170

原创 评分预测问题

离线实验方法评分预测算法平均值最简单的评分预测算法是利用平均值预测用户对物品的评分的。全局平均值用户评分平均值用户分类对物品分类的平均值基于领域的方法基于用户的邻域算法基于物品的邻域算法隐语义模型与矩阵分解模型SVD分解Simon Funk的SVD分解(学渣这一部分看不懂,就随便做点笔记吧)Simon Funk在博客上公布了一个算法(称为Funk-...

2019-08-18 20:20:11 343

原创 推荐系统架构

推荐系统通过分析用户的行为日志,给用户生成推荐列表,最终展示到网站的界面上。外围架构推荐系统要发挥强大的作用,除了推荐系统本身,主要还依赖于两个条件——界面展示和用户行为数据。看看目前流行的推荐系统界面,可以看到这些界面都有一些共性:通过一定方式展示物品,主要包括物品的标题、缩略图和介绍等。很多推荐界面都提供了推荐理由,理由可以增加用户对推荐结果的信任度。推荐界面还需要提供一些按钮...

2019-08-18 19:09:45 339

原创 给用户推荐好友

好友推荐算法在社交网络上被称为链接预测(link prediction)。基于内容的匹配我们可以给用户推荐和他们有相似内容属性的用户作为好友。下面给出了常用的内容属性。用户人口统计学属性,包括年龄、性别、职业、毕业学校和工作单位等。用户的兴趣,包括用户喜欢的物品和发布过的言论等。用户的位置信息,包括用户的住址、IP地址和邮编等。基于共同兴趣的好友推荐根据用户喜欢的东西计算相识度...

2019-08-17 20:08:03 549

原创 信息流推荐

信息流就相当于我们的QQ空间,展示了好友最新的动态,我们更多的时候关心好友的说说是不是提到了自己。

2019-08-17 19:50:37 422

原创 实际系统中的社会化推荐算法

2019-08-16 20:38:23 190

原创 基于图的社会化推荐算法

在社交网站中存在两种关系,一种是用户对物品的兴趣关系,一种是用户之间的社交网络关系。

2019-08-16 20:36:19 391

原创 基于邻域的社会化推荐算法

2019-08-16 20:18:34 229

原创 社交网络数据的简介

获取社交网络数据的途径电子邮件我们可以通过分析用户的联系人列表了解用户的好友信息,而且可以进一步通过研究两个用户之间的邮件往来频繁程度度量两个用户的熟悉程度。用户注册信息用户的位置数据讨论和讨论组即时聊天工具社交网站社会图谱和兴趣图谱QQ为代表的社交网络称为社交图谱(social graph),人们的好友一般都是自己在现实社会中认识的人,比如亲戚、同学、同事等,而且好友关系是...

2019-08-16 20:08:17 1230

原创 地点上下文信息

不同地区的用户兴趣有所不同,用户到了不同的地方,兴趣也会有所不同。明尼苏达大学的研究人员提出过一个称为LARS(Location Aware Recommender System,位置感知推荐系统)的和用户地点相关的推荐系统。该系统首先将物品分成两类,一类是有空间属性的,比如餐馆、商店、旅游景点等,另一类是无空间属性的物品,比如图书和电影等。同时,它将用户也分成两类,一类是有空间属性的,比如给出...

2019-08-16 19:44:05 258

原创 时间段图模型

路径融合算法可以基于图上的广度优先搜索算法实现。

2019-08-16 19:12:38 335

原创 时间上下文推荐算法

用户所处的上下文(context)包括用户访问推荐系统的时间、地点、心情等,对于提高推荐系统的推荐系统是非常重要的。时间效应简介用户兴趣是变化的,物品也是有生命周期的,季节效应。系统时间特征的分析通过统计如下信息研究系统的时间特性:数据集每天独立用户数的增长情况,系统的物品变化情况,用户访问情况。以用如下指标度量网站中物品的生命周期:物品平均在线天数,相隔T天系统物品流行度向量的平均相似...

2019-08-16 18:59:43 757

原创 利用用户标签数据

根据给物品打标签的人的不同,标签应用一般分为两种:一种是让作者或者专家给物品打标签;另一种是让普通用户给物品打标签,也就是UGC(User Generated Content,用户生成的内容)的标签应用。UGC的标签系统是一种表示用户兴趣和物品语义的重要方式。当一个用户对一个物品打上一个标签,这个标签一方面描述了用户的兴趣,另一方面则表示了物品的语义,从而将用户和物品联系了起来。用户为什么进行...

2019-08-15 19:26:29 196

原创 Appium的安装

安装教程https://blog.csdn.net/qq_16206535/article/details/79586818Node.js下载网址:https://nodejs.org/en/download/一路傻瓜安装,查看是否安装成功,在cmd输入node -v和npm下载Android SDK下载地址:https://www.androiddevtools.cn/我将SDK安...

2019-08-14 19:58:22 168

原创 推荐系统冷启动问题

冷启动问题简介解决办法利用用户注册信息将用户所属类别的各张表查询出来的结果按照一定权重相加,得出用户的最终推荐列表。规范表述如下:...

2019-08-14 19:56:22 104

原创 自然语言处理的基础知识

自然语言处理的定义美国计算机科学家马纳瑞斯(Bill Manaris)在《从人-机交互的角度看自然语言处理》一文中给自然语言处理提出的如下定义:自然语言处理(natural language processing, NLP)可以定义为研究在人与人交际中以及在人与计算机交际中的语言问题的一门学科。自然语言处理要研制表示语言能力(linguistic competence)和语言应用(lingui...

2019-08-05 19:36:31 1095 1

杭电ACM竞赛队上课课件

杭电ACM竞赛队上课课件,ACM选手的入门第一步,在杭电刘教主的课件下逆袭成大神

2018-09-22

北京大学Python课件

北京大学的Python语言课件,讲解的PPT简单好学,让小白快速入门

2018-09-22

康拓展开和逆康拓展开

ACM算法里的康拓展开和逆康拓展开,适合ACM竞赛的小白

2018-09-22

数学建模书籍

数学建模的学习书籍,非常有用,代码是用matlab实现的

2018-09-12

hadoop基础知识

大数据基础知识,适合无基础的大数据小白们,了解hadoop的基础架构

2018-09-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除