自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (10)
  • 收藏
  • 关注

原创 漫谈搜素引擎的排序模型

万变不离其宗,搜索引擎的搜索结果排序算法模型,可以抽象为计算每一个doc的p(d|q),利用朴素贝叶斯算法原理,p(d|q)=p(q|d)*p(d)/p(q),p(q)对于每一个doc都是一样的,所以最终的排序打分是p(q|d)*p(d),p(q|d)是query和doc的匹配程度,p(d)是每个doc的本身的打分,而doc本身的打分可以定义的角度非常多,和诸多的因素有关。Lucene默认的排序算

2015-01-07 20:58:43 4200 1

原创 搜索推广中的查询词扩展

搜索在移动内容分发入口中占有很大的比重,相比较于搜索列表中的应用,搜索广告是在最优的位置展示推广的应用,用户的查询意图比较明显,可以进行高效的推广开发者的应用。对于广告位置的竞争排名,搜索广告一般的做法是,先对用户的query进行扩展,扩展之后再和广告的竞价词进行匹配,筛选匹配的广告,再根据质量得分*出价进行排序,质量得分一般是由很多的个因素组成,有广告应用的历史下载量、广告人气、以及query和

2015-01-07 13:43:58 3552

原创 大数据应用能力层次模型

画了一张在实践中的大数据应用能力层次模型草图,大数据应用的几个阶层从数据的基础平台,业务运营监控支撑,精细化的运营和营销,以及数据对外的服务和市场传播

2015-01-01 16:22:45 4298 1

原创 总结数据挖掘预测分类中的样本筛选和特征处理

基于特征化工程进行用户特征化,结合相关的机器学习算法对业务进行挖掘建模,在广告的精准投放、预测、风控等领域中应用的非常广泛。无论是有监督的学习分类算法,还是无监督的聚类也罢,都需要建立特征向量,对特征进行预处理;其中对于有监督的训练时,还需要进行样本的筛选。本章节讲解一下样本选择和特征处理方面的一些方法技巧。在做样本训练前需要挑选样本,需要注意样本不平衡的问题,比如在定向广告预估点击率二元模型中,

2015-01-01 15:44:45 17086 4

原创 内容分发平台个性化推荐系统经验简单总结

推荐在电商和互联网应用中已经应用的非常广泛,相比于根据query进行主动的搜索,推荐是更加被动的由系统自动推出商品给用户。搜索的意图比较明显,直接由query给出,而推荐需要计算猜测用户的意图,根据用户历史数据和当前行为,基于各种模型推荐合适的商品,提升用户体验,提高转化率。不过近些年来,搜索和推荐在底层模型和技术方面越来越趋于融合,利用机器学习的方式来改进搜索和推荐的质量,像搜索排序LTR等等。

2015-01-01 15:37:52 15610

基于用户画像的大数据实践

用户画像的实际经验、推荐系统、大数据相关的资料 用户画像的实际经验、推荐系统、大数据相关的资料

2018-05-22

大数据平台及推荐的应用

大数据平台 hadoop spark storm 用户画像体系 推荐 广告

2015-09-04

互联网架构设计

空间换时间 数据与计算切分 多维度可用 伸缩 优化资源利用

2015-09-04

互联网架构设计理念漫谈

高并发高可用的可伸缩的架构设计的原则 空间换时间 数据与计算 多维度可用 伸缩 优化资源利用

2013-12-17

HBase分页查询的rowkey设计技巧

用户历史订单列表查询rowkey设计技巧 最左前缀原则

2013-09-20

HBase 培训ppt

HBase 架构原理,从Nosql的提出,CAP 基于列式的高效存储 强一致的数据访问 高可靠 高性能 可伸缩,自动切分,迁移 Schema free

2013-03-31

linux util包

linux的一些工具包,包括uuid-dev luuid 等

2013-01-05

TCP.IP.Sockets.in.Java.2nd.Edition

描述Socket的通讯机制,nio机制 Socket就是TCP/IP协议的一种实现.它封装了TCP/IP协议并提供了一组基于该协议的操作方法

2010-04-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除