recommender_system
码龄10年
关注
提问 私信
  • 博客:54,226
    54,226
    总访问量
  • 8
    原创
  • 1,899,994
    排名
  • 63
    粉丝
  • 0
    铁粉

个人简介:上海理工大学,光电信息与计算机工程学院,网络计算实验室。研究方向:推荐系统,信息检索,数据挖掘,机器学习,自然语言处理。

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2014-12-12
博客简介:

一路向前

博客描述:
在劳动中热爱生命,便是通晓了生命的最深秘密。
查看详细资料
个人成就
  • 获得52次点赞
  • 内容获得7次评论
  • 获得76次收藏
创作历程
  • 2篇
    2015年
  • 6篇
    2014年
成就勋章
TA的专栏
  • 总结规划
    2篇
  • 资料分享
  • 论文讲解
  • 推荐算法
  • Hadoop生态系统
    5篇
  • 数据算法
  • 经典算法
  • 研究成果
  • 参考书籍
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

176人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

给师弟师妹们学习数据挖掘的一些建议

看着刚进实验室的师弟师妹们的迷茫,虽然也与他们进行过一些零散的交谈,但是都不够系统。因此,根据自己的经历给出学习数据挖掘的一些建议,大家可以根据自身的情况,具体问题具体分析,作为参考。希望在上一届的基础上,走的更深,走的更远。
原创
发布博客 2015.11.28 ·
22482 阅读 ·
38 点赞 ·
4 评论 ·
129 收藏

协同过滤推荐算法的初步了解与实战

协作型过滤是1992年David Goldberg 在施乐帕研究中心(Xerox PARC)的一篇题为《Using collaborative filtering to weave an information tapestry》的论文中首次使用的。现在大多数的web站点在各个方面都运用到了协作型过滤算法。本文简单介绍基于用户的协同过滤算法和基于物品的协同过滤算法原理,最后将运用算法实现推荐观
原创
发布博客 2015.10.09 ·
1641 阅读 ·
2 点赞 ·
0 评论 ·
2 收藏

一路向前大数据推荐算法团队

仿佛被诸神施了诅咒一样的西西弗斯,他把一块巨石推上山顶,而由于那块巨石太重了,每每未上山顶就又滚下山去,前功尽弃,于是他就不断重复、永无止境地做这件事,而且每次都是从零开始做起。这就让我想起了杜牧《阿房宫赋》中最后一段的最后一句,换句话说,也就是"前界不暇自哀,而后界哀之;后界哀之而不鉴之,亦使后界而复哀后界也"。做大数据推荐,每界学生都要从数据的抓取或收集、数据的预处理、数据的建模、数据的评估和
原创
发布博客 2014.12.20 ·
3809 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

分布式存储与分布式计算

一、高性能计算目前自己知道的高性能计算工具,如下所示:Hadoop:Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。Spark:Spark是UC Berkeley AMP lab所开源的类Hadoop MapReduce的通用的并行,Spark,拥有Hadoop MapReduce所具
原创
发布博客 2014.12.19 ·
12197 阅读 ·
2 点赞 ·
1 评论 ·
14 收藏

WordCount源码剖析

为了把抽象问题转化成为具体问题,深入理解MapReduce的工作原理,因此,以WordCount为例,详细分析MapReduce是怎么来执行的,中间的执行经过了哪些步骤,每个步骤产生的结果是什么。简单来说,大体上工作流程是Input从HDFS里面并行读取文本中的内容,经过MapReduce模型,最终把分析出来的结果用Output封装,持久化到HDFS中。一、WordCount的Map过程1
原创
发布博客 2014.12.19 ·
5479 阅读 ·
4 点赞 ·
2 评论 ·
9 收藏

MapReduce工作原理

一、MapReduce模型框架       MapReduce是一个用于大规模数据处理的分布式计算模型,最初由Google工程师设计并实现的,Google已经将完整的MapReduce论文公开发布了。其中的定义是,MapReduce是一个编程模型,是一个用于处理和生成大规模数据集的相关的实现。用户定义一个map函数来处理一个Key-Value对以生成一批中间的Key-Value对,再定义一个r
原创
发布博客 2014.12.19 ·
5367 阅读 ·
2 点赞 ·
0 评论 ·
12 收藏

Hadoop分布式文件系统和I/O

一、Hadoop数据类型Hadoop提供的数据类型,如下所示:BooleanWritable:标准布尔型数值ByteWritable:单字节数值DoubleWritable:双字节数FloatWritable:浮点数IntWritable:整型数LongWritable:长整型数Text:使用UTF8格式存储的文本NullWritable:当中的key或value为空时使用说明
原创
发布博客 2014.12.17 ·
1063 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

4台Hadoop集群完全分布式搭建

一、集群拓扑结构集群软件,如下所示:jdk-1.7.0hadoop-0.20.2mahout-0.5.0ubuntu-12.04说明:(1)四台计算机的用户名均为computer。(2)所有软件均放在/home/computer/目录下面。(3)master的作用是NameNode,Secondary,JobTracker。(4)slaver1,sl
原创
发布博客 2014.12.16 ·
2161 阅读 ·
2 点赞 ·
0 评论 ·
3 收藏