- 博客(8)
- 资源 (4)
- 收藏
- 关注
转载 数据分析能力的8个等级
并非所有的分析方法作用都相同。和大多数软件解决方案一样,你会发现分析方法的能力也存在差异,从简单明了的到高级复杂。下面我们按照不同分析方法所能给人带来的智能程度,把分析能力划分为8个等级。1. 固定报表回答: 发生了什么?什么时候发生的?示例:月度或季度财务报表我们都见过报表,它们一般是定期生成
2013-07-10 14:16:04 1629
转载 解答数据挖掘初学者心中的疑惑
摘要: 本文中包含了数据挖掘初学者常见的问题,DMFighter对我以前回复的一些问题进行了精心的整理,在此也感谢他的辛勤工作。因为访问我博客的很多读者会不断重复提这些问题,所以我把DMFighter整理的帖子也转载过来,请初 ...本文中包含了数据挖掘初学者常见的问题,DMFighter对我以前回复的一些问题进行了精心的整理,在此也感谢他的辛勤工作。因
2013-07-09 19:47:55 1190 1
转载 数据分析达人博客
1. 沈浩老师中国传媒大学教授,这位老师给我深的印象就是比较喜欢旅游、爱摄影,除此之外更多的介绍还一下子想不起来。不过在博客分享了很多非常好的数据分析方法、数据可视化等。 2. 刘万祥ExcelPro 刘万祥老师,《Excel图表之道》、《用地图说话》作者。专注于最专业、有效的商务图表沟通方法,追求图表的有效沟通,和专业的商务气质。 3.
2013-07-09 19:44:16 1878
转载 数据挖掘中易犯的几大错误
摘要: 数据挖掘中易犯的11大错误包括:缺乏数据、太关注训练、只依赖一项技术、提错了问题、只靠数据来说话、使用了未来的信息、抛弃了不该忽略的案例、轻信预测、 试图回答所有问题、随便地进行抽样、太相信最佳模型。按照Elder博士的总结,这几大易犯错误包括:缺乏数据(Lack Data)太关注训练(Focus on Trainin
2013-07-09 18:28:56 1026
转载 数据挖掘与云计算—专访中科院何清博士
——专访中国科学院计算技术研究所何清 博士 重庆邮电大学数字通信 张诚 数字通信:当今世界处于一个数据爆炸时代,如何有效地从海量数据中找到有用、可理解的知识正考验人类智慧,我们是否拥有应对这一挑战的技术手段? 何清:人类社会信息正以“每18个月产生的数量等于过去几千年的总和”的速度不断增加,如此浩瀚的数据在带给人们大量信息的同时,也极大地增加了人们
2013-07-09 18:21:07 2306
原创 Mahout
What is Mahout, why need it?Apache Mahout 简介Apache Mahout问答Mahout安装图文版Mahout下载mahout百度Apache Mahout维基百科MapReduce百科
2013-07-08 17:35:42 625
转载 扒一扒这个数据挖掘行业
摘要: 我干这行有几年了,见了很多人,干了很多公司,爆一爆这个行业的状况吧……让后来人有所了解,也让猎头挖人挖的有点方向,起码和candidates聊天的时候不至于什么也不清楚谈不明白,不清楚价值,等等声明:本文指的是做数据挖掘这行,不是数据仓库我干这行有几年了,见了很多人,干了很多公司,爆一爆这个行业的状况吧……让后来人有所了解,也让猎头挖人挖
2013-07-07 20:17:33 1289 1
转载 overfitting(过度拟合)的概念
overfittingoverfittingt是这样一种现象:一个假设在训练数据上能够获得比其他假设更好的拟合,但是在训练数据外的数据集上却不能很好的拟合数据。此时我们就叫这个假设出现了overfitting的现象。出现这种现象的主要原因是训练数据中存在噪音或者训练数据太少。而解决overfit的方法主要有两种:提前停止树的增长或者对已经生成的树按照一定的规则进行后剪枝。
2013-07-06 19:39:08 24801
统计学方法与数据分析(上下册)
2013-12-29
WEKA入门用的银行数据集bank-data.arff
2013-12-22
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人