Stay hungry, Stay foolish

新浪微博: Ralph_adu

排序:
默认
按更新时间
按访问量

Learning To Rank之LambdaMART的前世今生

LambdaMART是Learning To Rank的其中一个算法,适用于许多排序场景。它是微软Chris Burges大神的成果,最近几年非常火,屡次现身于各种机器学习大赛中,Yahoo! Learning to Rank Challenge比赛中夺冠队伍用的就是这个模型,据说Bing和Fac...

2014-11-02 17:57:28

阅读数:43598

评论数:9

主题模型-LDA浅析

上个月参加了在北京举办SIGKDD国际会议,在个性化推荐、社交网络、广告预测等各个领域的workshop上都提到LDA模型,感觉这个模型的应用挺广泛的,会后抽时间了解了一下LDA,做一下总结: (一)LDA作用         传统判断两个文档相似性的方法是通过查看两个文档共同出现的单词的多少,...

2012-09-03 14:09:24

阅读数:223504

评论数:34

基于物品的协同过滤推荐算法——读“Item-Based Collaborative Filtering Recommendation Algorithms”

最近参加KDD Cup 2012比赛,选了track1,做微博推荐的,找了推荐相关的论文学习。“Item-Based Collaborative Filtering Recommendation Algorithms”这篇是推荐领域比较经典的论文,现在很多流行的推荐算法都是在这篇论文提出的算法的基...

2012-03-17 00:58:39

阅读数:67455

评论数:28

浅谈网络广告

今天下午参加了品友公司举办的技术交流会,该公司是做数字广告平台的,听了一下午,技术上只了解了那么几个概念,收获不大,倒是对网络广告的模式有了基本的认识。当听到他们公司广告投放平台是怎么运作的时候,对网络投放广告盈利模式比较感兴趣,所以对这块听的比较投入,随手用Evernote做了下笔记。     ...

2012-02-19 01:10:57

阅读数:3980

评论数:12

史上最全的搜索下拉提示用户交互研究——读《An Eye-tracking Study of User Interactions with Query Auto Completion》

搜索下拉提示(Query Auto Completion,简称QAC)现在几乎是每个搜索引擎必备的基本功能,作用是在用户在搜索框输入查询词的过程中,给用户展示一系列搜索查询query供用户选择,可以方便用户输入、缩短用户搜索时间、提高用户搜索体验。在这方面的研究已经有很多,如基于上下文、基于时间序...

2014-11-09 18:20:58

阅读数:2995

评论数:0

频繁项集挖掘算法之FPGrowth

背景:         频繁项集挖掘算法用于挖掘经常一起出现的item集合(称为频繁项集),通过挖掘出这些频繁项集,当在一个事务中出现频繁项集的其中一个item,则可以把该频繁项集的其他item作为推荐。比如经典的购物篮分析中啤酒、尿布故事,啤酒和尿布经常在用户的购物篮中一起出现,通过挖掘出啤酒...

2014-01-01 22:30:23

阅读数:41966

评论数:6

Bloom Filter的基本原理和变种

学习一个东西首先要知道这个东西是什么,可以做什么,接着再了解这个东西有什么好处和优势,然后再学习他的工作原理。下面我们分别从这三点简单介绍一下bloom filter,以及和他的变种。 What:在允许一定的错误率的情况下,用于判断一个元素是否属于一个集合,Bloom Filter可能会将一...

2013-12-14 18:21:02

阅读数:2445

评论数:0

Hadoop伪分布模式搭建

这两天在看《Hadoop in Action》,尝试着搭建伪分布模式,即在“单节点集群”运行Hadoop,步骤:                 1. 配置conf文件夹下hadoop-env.sh文件的JAVA_HOME环境变量指向Java安装目录 export JAVA_HOME=/usr...

2012-12-30 11:30:01

阅读数:2773

评论数:0

Weka中的ARFF文件

Weka中用的ARFF文件格式分为两部分:Header 和Data。其中Header部分用于定义Relation的名字、一系列Attribute的名字和类型,比如: @RELATION iris @ATTRIBUTE sepallength NUMERIC @ATTRIB...

2012-12-13 17:00:18

阅读数:7478

评论数:0

插入查找元素效率问题——《编程珠玑》读书笔记

这两天看了第13章,看了好长一段时间,主要花在理解和编程实现上面,感觉自己的理解能力还有待提高。         这一章主要讲如何实现一个有序集合(Set),该集合插入元素时不能插入重复元素,每次插入完后集合中元素的排列是有序的。书上一共使用了6种数据结构实现这个集合:STL中的set(红黑数)...

2012-07-09 21:59:02

阅读数:2147

评论数:0

位图排序及其扩展应用——《编程珠玑》读书笔记

一、基本的位图排序         问题1:输入一个包含n=100万个正整数的文件,每个正整数都小于N=1000万,而且这100万个正整数没有重复,对这个文件的数字进行排序,保存结果到文件中。要求占用尽可能小的内存,速度尽可能快。         分析解决:如果用一个int保存一个正整数,...

2012-06-03 16:49:36

阅读数:2841

评论数:0

洗牌程序

之前在写抽样问题——《编程珠玑》读书笔记这篇文章的时候提到将一个数列进行重新排列,目的是弄乱原有数据的排列,相当于洗牌,这篇文章主要讲讲这个洗牌程序的实现。         一、Fisher–Yates Shuffle         最早提出这个洗牌方法的是 Ronald A. Fish...

2012-06-01 00:47:14

阅读数:7376

评论数:1

蓄水池抽样——《编程珠玑》读书笔记

问题:如何随机从n个对象中选择一个对象,这n个对象是按序排列的,但是在此之前你是不知道n的值的。         思路:如果我们知道n的值,那么问题就可以简单的用一个大随机数rand()%n得到一个确切的随机位置,那么该位置的对象就是所求的对象,选中的概率是1/n。         但现在我们...

2012-05-31 17:18:15

阅读数:24292

评论数:8

抽样问题——《编程珠玑》读书笔记

问题:输入两个整数m和n,并且m         方法一:         Knuth著作《Seminumerical Algorithms》中提出的方法,顺序遍历n个数,通过随机测试条件的元素被选择。         以一个例子来解释所说的随机测试条件,比如m=2,n=5。第一个元素0被选...

2012-05-30 20:40:19

阅读数:2807

评论数:0

手把手教你把Vim改装成一个IDE编程环境(图文)

手把手教你把Vim改装成一个IDE编程环境(图文) 本文转自:http://blog.csdn.net/wooin/article/details/1858917 By: 吴垠 Date: 2007-09-07 Version: 0.5 Em...

2012-05-12 14:59:41

阅读数:2251

评论数:0

一道笔试题——由数组中除了一个数之外的其他数的乘积生成另一个数组

一、题目         对于一个数组A[N],要求生成一个新的数组B[N]。对数组B的要求是B[i] = A[0] * A[1]…*A[i - 1] * A[i + 1]*…*A[N],也就是不包括A[i]的剩余元素之积。         二、要求         1. 不允许使用除法; ...

2012-04-13 15:50:36

阅读数:2460

评论数:0

位操作基础篇之位操作全面总结

位操作篇共分为基础篇和提高篇,基础篇主要对位操作进行全面总结,帮助大家梳理知识。提高篇则针对各大IT公司如微软、腾讯、百度、360等公司的笔试面试题作详细的解答,使大家能熟练应对在笔试面试中位操作题目。       下面就先来对位操作作个全面总结,欢迎大家补充。 在计算机中所有数据都是...

2012-03-20 09:28:51

阅读数:1410

评论数:0

动态规划——装配线调度问题

一、问题描述         装配线调度问题如下:         Colonel汽车公司在有两条装配线的工厂内生产汽车,一个汽车底盘在进入每一条装配线后,在每个装配站会在汽车底盘上安装不同的部件,最后完成的汽车从装配线的末端离开。如下图1所示。 ...

2012-03-19 15:03:01

阅读数:2464

评论数:2

C++ STL原来可以这么强大

今天在做C++ Primer第14章习题14.37的时候用到了一些STL的函数,彻底颠覆了我对C++的看法。以前总觉得C++很麻烦,实现一个功能总要写一堆的代码,很繁琐,那是菜鸟时候的想法。虽然现在也还是菜鸟,但级别比原来提高了一点,今天使用了STL的算法之后才知道,原来C++也可以这么简洁。 ...

2012-03-15 11:57:50

阅读数:4204

评论数:7

C++访问控制之private剖析

今天在看C++ Primer,写重载操作运算符练习程序的时候,在成员函数中直接操作形参中同类型对象的private成员,程序如下: OperatorOverload& OperatorOverload::operator=(const OperatorOverload &op...

2012-03-12 11:55:02

阅读数:2377

评论数:2

提示
确定要删除当前文章?
取消 删除
关闭
关闭