数据分析与挖掘
文章平均质量分 92
桸櫾桎栘
任何的限制都是从自己内心开始的
展开
-
数据挖掘在医学上的应用
原文地址:数据挖掘在医学上的应用作者:枫叶松木木上一篇博文,我们介绍了数据挖掘在商业中的应用,其中谈到了数据挖掘在金融方面的应用,也介绍了一点有关数据挖掘在医学上的应用。本篇将再多讲一讲数据挖掘在医学上的应用,希望能对感兴趣的朋友有所启发,也供从事其他行业数据挖掘应用的同仁参考。 数据挖掘,又称知识发现(KDD),是从大量的数据中抽取潜在的、有价值的知识的过程。数据挖掘所探寻的模式是一种客转载 2015-04-14 17:15:34 · 3490 阅读 · 0 评论 -
聚簇索引与非聚簇索引的区别
原文地址:聚簇索引与非聚簇索引的区别作者:菜鸟的成长 通常情况下,建立索引是加快查询速度的有效手段。但索引不是万能的,靠索引并不能实现对所有数据的快速存取。事实上,如果索引策略和数据检索需求严重不符的话,建立索引反而会降低查询性能。因此在实际使用当中,应该充分考虑到索引的开销,包括磁盘空间的开销及处理开销(如资源竞争和加锁)。例如,如果数据频繁的更新或删加,就不宜建立索引。 本文简要转载 2015-04-14 17:15:57 · 465 阅读 · 0 评论 -
Apche日志分析
本文转载自http://www.cnblogs.com/xiaochaohuashengmi/archive/2011/04/24/2026559.html本文分五个部分:访问日志、错误日志、定制日志、日志分析、其他用法。摘自永远的Linux,做了一些修整。 Apche日志系列(1):访问日志 想要知道什么人在什么时候浏览了网站的哪些内容吗?查看Apache的访问日志就可以知道。原创 2015-04-14 17:16:23 · 378 阅读 · 0 评论 -
如何用EXCEL求一组数的方差…
原文地址:如何用EXCEL求一组数的方差和标准差以及均值作者:高卓如求一组数的方差: 点击想放方差的表格空白处,然后在上面的窗口中的FX右边的窗口中输入“=VAR(数组起始位置:数组结束位置)”[输入时不输入引号] 例子:求B2到B100中的数组的方差,并放到 C2 这一空格中,则输入时这样=VAR(B2:B100) 然后回车。即可求出。 求C2方差的标准差,并放到D2中,做法转载 2015-04-14 17:15:52 · 6486 阅读 · 0 评论 -
机器学习入门的书单(数据挖…
原文地址:机器学习入门的书单(数据挖掘、模式识别等一样)转作者:想法简单(写在前面)昨天说写个机器学习书单,那今天就写一个吧。这个书单主要是入门用的,很基础,适合大二、大三的孩子们看看;当然你要是大四或者大四以上没看过机器学习也适用。无论是研究智能还是做其他事情,机器学习都是必须的。你看GFW都用机器学习了,咱是不是也得科普一下。(全文结构)其实,我想了想,学一门学科,列出一堆书,评论来评论去的转载 2015-04-14 17:15:05 · 561 阅读 · 0 评论 -
分类算法总结
决策树分类算法决策树归纳是经典的分类算法。它采用自顶向下递归的各个击破方式构造决策树。树的每一个结点上使用信息增益度量选择测试属性。可以从生成的决策树中提取规则。KNN法(K-Nearest Neighbor):KNN法即K最近邻法,最初由Cover和Hart于1968年提出的,是一个理论上比较成熟的方法。该方法的思路非常简单直观:如果一个样原创 2015-11-27 18:18:06 · 600 阅读 · 0 评论 -
决策树入门篇
转自:http://www.cnblogs.com/huangxf/p/4342929.html前言:分类是数据挖掘中的主要分析手段,其任务就是对数据集进行学习并构造一个拥有预测功能的分类模型,用于预测未知样本的类标号,把类标号未知的样本按照某一规则映射到预先给定的类标号中。分类模型学习方法其中一类就是基于决策树的学习方法,下面,简单总结一下决策树的基础知识和构造决策树的两种算法:转载 2015-11-29 20:12:03 · 576 阅读 · 0 评论 -
XGboost参数设置
XGBoost参数在运行XGboost之前,必须设置三种类型成熟:general parameters,booster parameters和task parameters:General parameters:参数控制在提升(boosting)过程中使用哪种booster,常用的转载 2016-03-01 09:38:34 · 8668 阅读 · 0 评论