DM
文章平均质量分 88
stund
这个作者很懒,什么都没留下…
展开
-
J48 源码学习| Weka
J48 C4.5决策树算法源码学习 题记: 之前虽然对 J48 用得比较多,是由于它能方便的区别特征的好坏。 工作了,希望自己能更深入, 如是开始了这个算法学习系列。 希望和大家共同进步。个人对看算法源代码也没有很好的流程,计划先采用 按类Class 做架构介绍;再深入代码具体逻辑的方式展开。 欢迎大家提出好的算法源码阅读流程。一、 准备工作。下载 weka 的工具包,将 wek原创 2013-08-25 20:38:26 · 3363 阅读 · 0 评论 -
机器学习中的代数结构的建立
Learning是一个融会多种数学于一体的领域。说起与此有关的数学学科,我们可能会迅速联想到线性代数以及建立在向量空间基础上的统计模型——事实上,主流的论文中确实在很大程度上基于它们。R^n (n-维实向量空间) 是我们在paper中见到最多的空间,它确实非常重要和实用,但是,仅仅依靠它来描述我们的世界并不足够。事实上,数学家们给我们提供了丰富得多的工具。 “空间”(space转载 2013-10-07 10:48:26 · 931 阅读 · 0 评论 -
2016 年度消费信贷建模小结
一、2016年度忙碌的工作与技术积累1.1 第一版通用信用模型:201601 开始建模。梳理大数据特征风控建模的过程如下:样本:从LDYS购买到sms中收到逾期3次以上定义为坏,从来没有收到逾期的定义为好。特征:细粒度搜索词、大数据用户画像(自然属性、社会属性、兴趣与需求属性)、LBS(家、公司、到访等)、各大类产品线按每1/3/6/12月做原创 2017-01-20 14:01:40 · 2737 阅读 · 0 评论 -
2016 小结之用户所在行业画像
画像标签中的用户所在行业挖掘,是一个典型的日志文本挖掘,给用户打上有价值的高级标签的过程。设计到数据挖掘的全过程。对数据挖掘的要求层面较高。原创 2015-12-26 15:34:52 · 2775 阅读 · 0 评论 -
Optimized Cost per Click in Taobao Display Advertising-oCPC 店商广告投放经典论文
欢迎转载,请注明出处:1、背景简介开篇之前先咳咳瓜子磨磨牙,之前了解oCPC概念是从今日头条流传出来的,之后各种寻找终于找到大淘宝的一篇开创性的论文。点个赞!下面正式开始。文章提出了Optimized Cost per Click(oCPC)方式去优化广告的排序问题-自动动态调整广告主对流量的竞价bid,控制roi的同时提高gmv。具体场景是淘宝这种能拿到最终转化数据的平台原创 2017-06-22 22:52:50 · 6926 阅读 · 1 评论