自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(14)
  • 资源 (5)
  • 收藏
  • 关注

原创 推荐系统的近期综述+经典论文及其实现

Recommender systems survey 2013 偏原理Recommender system application developments: A survey 2015 偏应用推荐 TU Delft 石玥(现在雅虎)14年发在CSUR的一篇综述[Shi et al., 2014] Yue Shi, Martha Larson, and Alan Hanjalic. Coll

2017-04-27 08:59:16 2351

原创 《统计学习方法》学习笔记(6)-- 决策树-附代码(sklearn)

决策树,特征选择的三个准则:信息增益(ID3),信息增益比(C4.5),基尼系数(CART)。决策树的生成,决策树的剪枝。

2017-04-25 17:09:38 1002

原创 《统计学习方法》学习笔记(5)-- 朴素贝叶斯法

贝叶斯法 分类

2017-04-25 11:27:08 410

原创 《统计学习方法》学习笔记(3)--感知机

补点小常识:1958年,(李航老师《统计学习方法中》说到的是1957年)计算科学家Rosenblatt提出了由两层神经元组成的神经网络–“感知器”(Perceptron)–单层神经网络。感知器是当时首个可以学习的ANN。Rosenblatt现场演示了其学习识别简单图像的过程,在当时的社会引起了轰动。人们认为已经发现了智能的奥秘,许多学者和科研机构纷纷投入到神经网络的研究中。美国军方大力资助并认为神经

2017-04-24 10:49:52 739

原创 《统计学习方法》学习笔记(2)--模型选择、泛化能力

1.泛化能力用来表征学习模型对于未知数据的预测能力。 为了避免过拟合,且使误差最小,模型选择的常用方法有:正则化和交叉验证。正则化是结构风险最小化策略的实现=经验风险最小化+正则化项/罚项 交叉验证 简单交叉验证,将数据70%作为训练集,30%作为测试集,然后选出测试误差最小的模型S-fold交叉验证,将数据随机分成S份,将S-1份作为训练集,剩下的作为测试集,对于训练集和测试集有S种选择,

2017-04-24 10:36:55 1643

转载 隐马尔科夫模型的应用实例:中文分词

什么问题用HMM解决现实生活中有这样一类随机现象,在已知现在情况的条件下,未来时刻的情况只与现在有关,而与遥远的过去并无直接关系。比如天气预测,如果我们知道“晴天,多云,雨天”之间的转换概率,那么如果今天是晴天,我们就可以推断出明天是各种天气的概率,接着后天的天气可以由明天的进行计算。这类问题可以用 Markov 模型来描述。进一步,如果我们并不知道今天的天气属于什么状况,我们只知道今明后三天的水藻

2017-04-22 21:52:01 3594 1

原创 用户画像杂谈

用户画像是针对产品/服务目标群体真实特征的勾勒,是真实用户的综合原型。昨晚上看了两篇关于用户画像的文章,做总结如下 1. 如何避免形式主义的用户画像 这篇文章主要围绕着如何设计用户标签体系展开。开篇先讲解了“用户画像”和其另一个名字“受众定向”,作者认为我们平时说的“用户画像”听起来更加关注人口属性、生活状态等静态信息,这并没有表达出我们的重点关注点(例如:某用户“最近要不要旅游”、“准备买多少

2017-04-18 09:23:13 1450

原创 [入门笔记]神经网络浅讲:从神经元到深度学习

原文:神经网络浅讲:从神经元到深度学习 这篇文章介绍很好,深入浅出、很容易懂但是该有的东西都讲到了,一口气看下来会觉得很爽。因为文章很长所以下面主要是上文中的一些摘抄。1.神经网络的“三起三落” 1943年,心理学家McCulloch和数学家Pitts参考了生物神经元的结构,发表了抽象的神经元模型MP。 神经元: 影响: 1943年发布的MP模型,简单却建立了神经网络大厦的地基

2017-04-16 21:45:35 3334

原创 计算图(computational graph)角度看BP(back propagation)算法

从计算图(computational graph)角度看BP(back propagation)算法,这也是目前各大深度学习框架中用到的,Tensorflow, Theano, CNTK等。参考【1】一、通用形式1. 什么是计算图结构 从下图中我们可以清楚地看到 (1)可以将计算图看作是一种用来描述function的语言,图中的节点node代表function的输入(可以是常数、向量、张量等),

2017-04-15 15:18:02 14446 3

原创 windows下安装双版本anaconda,以及配置jupyter notebook的kernel

见:http://blog.csdn.net/qq_22073849/article/details/61927062activate py3

2017-04-13 08:42:51 995

转载 Netflix推荐系统的最新解读:算法、商业价值与创新

2009年由Netflix发起的Netflix Prize百万美金竞赛,绝对是推荐系统领域最标致性的事件,这次比赛不但吸引了众多专业人士开始投身于推荐系统领域的研究工作,也让这项技术从学术圈真正地进入到了商业界,引发了热烈的讨论并逐渐深入到了商业的核心腹地,功德无量。当然,最受益的肯定还是Netflix公司自己,不仅大有取代Amazon成为新一代推荐引擎之王的架势,而且从商业回报本身上看也无疑取得了

2017-04-09 19:52:46 10405 1

原创 协同过滤杂谈

两种memory-based CF对比: ItemCF:更常用一些,一个是因为其稳定性好,两个商品相似就是相似,但是两个用户之间的相似度要考虑时间因素;再一个是商品库里的商品就那么多,计算量级比较固定;还有一个是它发掘长尾商品的能力相对来说更强。 CF优缺点: 优点: (1)与基于内容的推荐多用于推荐文本类的item相比,CF不需要知道用户和items的属性,只基于用户和items间的交

2017-04-09 19:36:43 369

原创 用数据可视化直观理解数据--iris数据集为例

原文:https://www.kaggle.com/benhamner/d/uciml/iris/python-data-visualizations See Kaggle Datasets for other datasets to try visualizing. The World Food Facts data is an especially rich one for visualiza

2017-04-07 15:43:57 10879 1

原创 numpy_sheet

结合着: numpy常用矩阵计算函数总结>>>import numpy as np# 创建数组# np.array([(中填入想要创建的数组,若多维则将每一维用括号括起来,括号之间用,相隔])>>>np.array([(1.0,2,3),(3,4,5)])[out]array([[ 1., 2., 3.], [ 3., 4., 5.]])>>>np.arange(1,20

2017-04-03 11:51:35 472

hetesim简单实现

简单的矩阵实现。具体的可以根据论文的后半部分矩阵实现和这个小例子的程序更改。

2018-04-16

用数据可视化直观理解数据--iris数据集为例

用数据可视化直观理解数据--iris数据集为例,python实现,seaborn pandas matplotlib

2017-04-07

PathSim代码实现

异构信息网络中基于元路径APVPA的相似度PathSim实现,基于Path2.7

2016-03-29

java2 应用编程150例 【源码全】

《java2 应用编程150例 》书中所有源码

2014-11-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除