自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(19)
  • 资源 (5)
  • 收藏
  • 关注

转载 对级排序学习pairwise learning 偏好关系学习(RankBost)

转载自:Pairwise Leanrning - wentingtu - 博客园Pairwise Leanrning **************************************************************An Efficient Boosting Algorithm for Combining Prefere

2016-12-21 14:55:29 5359 1

转载 图模型推荐

推荐中的GRAPH MODEL - wentingtu - 博客园http://www.cnblogs.com/wentingtu/archive/2012/05/28/2521166.html应roger的要求,我在此总结一下graph model。推荐中对graph model的研究主要有两个方面,一个是如何构图,另一个是如何在图上做ranking。关于构图问题

2016-12-21 14:40:14 1296

原创 最大似然估计log likelihood

log likelihood——对数似然函数值在参数估计中有一类方法叫做“最大似然估计”,因为涉及到的估计函数往往是是指数型族,取对数后不影响它的单调性但会让计算过程变得简单,所以就采用了似然函数的对数,称“对数似然函数”.根据涉及的模型不同,对数函数会不尽相同,但是原理是一样的,都是从因变量的密度函数的到来,并涉及到对随机干扰项分布的假设.最大似然估计法的基本思想极大似然原理

2016-12-14 21:17:20 88941 1

原创 将数据集切分成“训练-测试数据集”和交叉验证

如何将数据集划分为测试数据集和训练数据集?把数据集分为两部分:分别用于训练和测试sklearn提供一个将数据集切分成训练集和测试集的函数。from sklearn.crose_validation import train_test_splitXd_train,Xd_test,y_train,y_test=train_test_split(X_d,y,random_state=14)

2016-12-07 11:05:04 22185

转载 libFM的使用

推荐系统学习04-LibMF - 风萧萧兮 - 博客频道 - CSDN.NEThttp://blog.csdn.net/chenkfkevin/article/details/51064292编译  在Ubuntu14.04上进行。环境需要g++4.6及以上。  将下载的压缩文件上传至Ubuntu,解压。  进入目录,输入“make”进行编译。

2016-12-06 21:10:29 5399

转载 生成libSVM的数据格式及使用方法总结

libFm的文本格式和libSVM的格式相同,所以研究了一下libSVM的格式生成libSVM的数据格式及使用方法总结 - Studying…… - 博客频道 - CSDN.NEThttp://blog.csdn.net/kobesdu/article/details/8944851首先介绍一下 libSVM的数据格式Label 1:value 2:value ….

2016-12-06 21:08:39 2873

转载 推荐系统源码

1. LibFM项目主页:http://www.libfm.org/2. Svdfeature项目主页:http://apex.sjtu.edu.cn/apex_wiki/svdfeature3. Libsvm和Liblinearlibsvm项目主页:http://www.csie.ntu.edu.tw/~cjlin/libsvm

2016-12-06 15:44:55 2600

原创 处理关系数据使用libFM块

英文博文:https://thierrysilbermann.wordpress.com/2015/09/17/deal-with-relational-data-using-libfm-with-blocks/train.libfm5 0:1 2:1 6:1 9:12.55 0:1 3:1 6:1 9:204 0:1 4:1 6:1 9:781 1:1,2

2016-12-06 15:24:14 1600

原创 one-hot编码

在实际的应用场景中,有非常多的特征不是连续的数值变量,而是某一些离散的类别。比如在广告系统中,用户的性别,用户的地址,用户的兴趣爱好等等一系列特征,都是一些分类值。这些特征一般都无法直接应用在需要进行数值型计算的算法里,比如CTR预估中最常用的LR。那针对这种情况最简单的处理方式是将不同的类别映射为一个整数,比如男性是0号特征,女性为1号特征。这种方式最大的优点就是简单粗暴,实现简单。那最大的问题

2016-12-06 14:51:24 7772 2

原创 libfm in python

https://github.com/coreylynch/pyFM这是一个 python 实现的分解机 [1]。使用自适应正则化作为一种学习方法,适应正规化训练模型参数时,自动使用随机梯度下降。详情,请参阅 [2]。从 libfm.org:"分解机 (FM) 是允许通过来模拟大多数分解模型的特征工程的泛型方法。这种方式,分解机"相结合特征工程概论凭借优势的分解模型估计的大域分类变量之

2016-12-05 16:10:18 10346 4

原创 LibFM使用手册中文版

英文版原文:http://www.libfm.org/libfm-1.42.manual.pdf自己翻译libFM 1.4.2 - 指南Steffen Rendle [email protected] http://www.libfm.org/  2014年9月14日内容

2016-12-05 13:12:41 13561 6

转载 特征工程——特征分类及不同类特征的处理方式

特征分类对特征进行分类,对于不同的特征应该有不同的处理方法。根据不同的分类方法,可以将特征分为(1)Low level特征和High level特征。Low level特征——较低级别的特征,主要是原始特征,不需要或者需要非常少的人工处理和干预。例如文本特征中的词向量特征,图像特征中的像素点,用户id,商品id等。Low level特征一般维度比较高,不能用过于

2016-12-03 15:36:47 11179

转载 特征工程——广告系统

原文地址:http://blog.csdn.net/mytestmy/article/details/19088827

2016-12-03 15:15:19 1364

转载 特征工程——推荐系统里的特征工程

原文:推荐系统里的特征工程个性化推荐系统 Personalized recommender system 比其他的机器学习方法更依赖特征工程,所以我拿它来当作问题的背景,结合我之前做过的一个推荐系统里相关经验来说说特征工程具体是个什么东西。利用特征功能提取这些“个性化”的特征放到推荐模型里就很重要,比如在我们的推荐系统里,把“品牌”的特征加进去,相对于 baseline 提高了20%左

2016-12-03 14:43:32 4161

转载 特征工程——categorical特征 和 continuous特征

看到有些介绍,“特征分为categorical特征 和 continuous特征“不解,查资料得单个原始特征(或称为变量)通常属于以下几类之一:连续(continuous)特征;无序类别(categorical)特征;有序类别(ordinal)特征。##连续特征 除了归一化(去中心,方差归一),不用做太多特殊处理,可以直接把连续特征扔到模型里使用。##无序特征

2016-12-03 12:06:16 5875

原创 雅虎研究院数据集汇总

介绍:雅虎研究院的数据集汇总: 包括语言类数据,图与社交类数据,评分与分类数据,计算广告学数据,图像数据,竞赛数据,以及系统类的数据。

2016-12-02 19:07:51 3323

转载 关于Kdd cup

原博:http://blog.csdn.net/cserchen/article/details/38398917还有其他类型kaggle上近一段时间数据挖掘竞赛的获奖队伍的源代码,对掌握相应的数据挖掘技术很有帮助1.Kaggle's Allstate Purchase Prediction Challenge,代码github排名2 ,排名10 排名36

2016-12-02 18:59:02 758

转载 推荐系统开源软件列表汇总和点评

推荐系统开源软件列表汇总和点评 - CSDN - 博客频道 - CSDN.NEThttp://blog.csdn.net/cserchen/article/details/14231153

2016-12-02 18:55:06 818

转载 推荐算法工程

原文见:http://www.cnblogs.com/flclain/p/4211685.html总结归纳为:事实上搞推荐的工作不等于 import IBCF 或者 import time SVD++ import tensor啊做一个推荐系统,其问题在于几个方面:1.业务转化数学问题 2.数据特性定义active function 3.根据业务定义合理损失函数 4.损失函数求

2016-12-02 16:29:59 836

《corba中文版》带书签目录高清电子版非扫描

247页CORBA中文版,高清非扫描版。内容深入简出。

2015-03-14

《COM技术内幕》清晰电子扫描版

计算机经典丛书,清华大学出版社,Dale Rogerson著,杨秀章译

2015-03-14

javaweb开发技术方案宝典

第一章 开发模式选择方案 第二章 页面设计方案 第三章 数据持久化方案 第四章 数据检索方案 第五章 决策分析方案 第六章 报表打印方案 第七章 网络通信方案 第八章 网站安全实施方案 第九章 网站优化和发布方案

2013-07-11

《java数据库系统开发实例导航》

第二章 基于Struts的客户资料管理系统 第三章 基于Struts的人事管理系统 第四章 办公日志系统 第五章 电子政务档案管理系统 第六章 餐饮行业进销存系统 第七章 手机短信数据采集系统

2013-07-11

javaweb程序开发范例宝典17到21章

第十七章 表达式和标签的应用 第十八章 hibernate的应用 第十九章 struts框架的应用 第二十章spring框架的应用 第二十一章 综合应用(在线投票,用户注册,论坛,购物车,聊天室,万年历)

2013-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除