数据分析
junli_chen
这个作者很懒,什么都没留下…
展开
-
数据分享资料
淘宝TFS架构演进 链接:http://pan.baidu.com/s/1sjQBDa1 密码:lxz5 基于用户画像的大数据挖掘实践 链接:http://pan.baidu.com/s/1rUtbg 密码:j9zd 电商系统的一些心得分享 链接:http://pan.baidu.com/s/1pJ3FfK3 密码:f6yy原创 2015-09-01 15:28:46 · 468 阅读 · 0 评论 -
忘掉你的大数据,数据思维才最重要!
坦白讲如果没有拥有数据思维,那即使拥有了很多数据,而且不管这些数据有多大,都不能说你在做大数据,所以大数据的核心其实是要拥有数据思维。”1数据思维利用数据解决问题什么是数据思维?数据思维的最核心是利用数据解决问题,利用数据解决问题的最核心是要深度了解需求,了解真正要解决什么样的问题,解决问题背后的真实目的是什么。在解决问题的过程中我们转载 2015-12-17 20:57:12 · 840 阅读 · 1 评论 -
缺失值的处理方法
转载自http://blog.sina.com.cn/s/blog_670445240102v08m.html 对于数据挖掘和分析人员来说,数据准备(Data Preparation,包括数据的抽取、清洗、转换和集成)常常占据了70%左右的工作量。而在数据准备的过程中,数据质量差又是最常见而且令人头痛的问题。本文针对缺失值和特殊值这种数据质量问题,进行了初步介绍并推荐了一些处理方法转载 2016-01-21 20:09:30 · 3685 阅读 · 0 评论 -
非常好的理解遗传算法的例子
遗传算法的手工模拟计算示例为更好地理解遗传算法的运算过程,下面用手工计算来简单地模拟遗传算法的各 个主要执行步骤。 例:求下述二元函数的最大值: (1) 个体编码 遗传算法的运算对象是表示个体的符号串,所以必须把变量 x1, x2 编码为一种 符号串。本题中,用无符号二进制整数来表示。原创 2016-01-21 20:34:10 · 369 阅读 · 0 评论 -
数据挖掘算法之离散化和二元化
转载自:http://deepfuture.iteye.com/blog/1395669离散化和二元化有些数据挖掘算法,特别是某些分类算法,要求数据是分类属性形式。发现关联模式的算法要求数据是二元属性形式。这样,常常需要将连续属性变换成分类属性(离散化,discretization),并且连续和离散属性可能都需要变换成一个或多个二元属性(二元化,binariza转载 2016-01-21 20:35:02 · 6070 阅读 · 0 评论