- 博客(6)
- 资源 (1)
- 问答 (2)
- 收藏
- 关注
原创 推荐系统入门
1. 推荐系统的意义\quad互联网大爆炸时期的信息过载的解决方案:\quad对用户而言:找到好玩的东西,帮助决策,发现新鲜事物。 \quad对商家而言:提供个性化服务,提高信任度和粘性,增加营收。2. 推荐系统的构成\quad前台的展示页面,后台的日志系统,推荐算法等部分组成,如下图所示:3. 推荐系统的评测3.1 离线实验即线下的部分,用于训练模型优点:不需要有对实际系统的控制权;不需要用
2017-03-14 21:33:30 24349 2
原创 基于MLlib的机器学习
1. 简介\quadMLlib 是Spark 中提供机器学习函数的库。它是专为在集群上并行运行的情况而设计的。MLlib 中包含许多机器学习算法,可以在Spark 支持的所有编程语言中使用,由于Spark基于内存计算模型的优势,非常适合机器学习中出现的多次迭代,避免了操作磁盘和网络的性能损耗。Spark 官网展示的 MLlib 与Hadoop性能对比图就非常显著。所以Spark比Hadoop的Map
2017-03-13 20:25:04 5156 1
原创 Scala学习-类和对象
1. 创建类创建一个脚本Hyena.scala,内容如下:yqtao@yqtao:~/scala$ cat Hyena.scalaclass Hyena { println("this is an class body") //定义了方法go() def go():String={"go home"}}//生成对象val hyena = new
2017-03-12 16:23:18 862
原创 Caffe学习-手写数字识别
1. Caffe训练方法综述\quadcaffe非常简单,训练时只需写prototxt文件即可,其大致的步骤为:Resize图片,转换存储格式(LMDB/LevelDB)定义网络结构(编辑prototxt)定义solver(编辑另一个prototxt)一行命令开始训练(可以基于已有的权重赋值)\quad如下图所示,其训练的过程,关于卷积神经网络(CNN)可以参考:计算机视觉与卷积神经网络下
2017-03-11 17:56:44 7659
原创 Scala学习-快速入门
Scala 是一门多范式的编程语言,设计初衷是实现可伸缩的语言、并集成面向对象编程和函数式编程的各种特性。1. 安装Scala非常的简单,在ubuntu中只需要sudo apt-get install scala即可,在其他的linux中,找到下载源文件安装即可。安装成功后使用scala进入shell环境:yqtao@yqtao:~$ scalaWelcome to Scala version 2
2017-03-10 11:30:42 9465
原创 Spark学习-RDD编程基础
1. RDD基础概念\quadSpark上开发的应用程序都是由一个driver programe构成,这个所谓的驱动程序在Spark集群通过跑main函数来执行各种并行操作。集群上的所有节点进行并行计算需要共同访问一个分区元素的集合,这就是RDD(RDD resilient distributed dataset)弹性分布式数据集。RDD可以存储在内存或磁盘中,具有一定的容错性,可以在节点宕机重启后
2017-03-09 22:29:14 3429
关于STL编程是计算两个指针的距离问题
2016-07-26
c++二叉排序树根结点的问题,请大神来回答一下
2016-05-27
TA创建的收藏夹 TA关注的收藏夹
TA关注的人