![](https://img-blog.csdnimg.cn/20201014180756928.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据挖掘
schdut
记录学习笔记,欢迎交流讨论。
展开
-
《数据挖掘导论》学习笔记(第1-2章)
《数据挖掘导论》学习笔记(第1-2章)转载:《数据挖掘导论》学习笔记(第1-2章)转载 2017-10-21 18:52:06 · 1001 阅读 · 0 评论 -
研究生如何找到一份数据挖掘的工作
关于数据挖掘方面的研究,我原来也走过一些弯路。其实从数据挖掘的起源可以发现,它并不是一门崭新的科学,而是综合了统计分析、机器学习、人工智能、数据库等诸多方面的研究成果而成,同时与专家系统、知识管理等研究方向不同的是,数据挖掘更侧重于应用的层面。因此来说,数据挖掘融合了相当多的内容,试图全面了解所有的细节会花费很长的时间。因此我建议你的第一步是用大概三个月的时间了解数据挖掘的几个常用技术:分类、聚类、转载 2017-10-12 20:54:32 · 1915 阅读 · 0 评论 -
数据挖掘学习入门建议
作者:周琦 链接:https://www.zhihu.com/question/35055219/answer/61201204 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。1. 工具的学习python(我用的python tutorial,细节可以查书learning python,然后查询一些文档比如,numpy,matplotlib官方文档)jav转载 2017-10-12 21:00:47 · 1428 阅读 · 0 评论 -
两个常用的数据标准化方法及Matlab和Python实现
参考:数据归一化和两种常用的归一化方法,博主对原文进行了润色并添加了Matlab实现。数据标准化(归一化)处理是数据挖掘的一项基础工作,不同评价指标往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果。为了消除指标(特征)之间的量纲影响,数据集需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。以下是两...原创 2017-12-12 19:13:12 · 32633 阅读 · 13 评论 -
hash tree在apriori算法中如何进行支持度计数 数据挖掘导论(完整版)第六章
好几天没写博客了,把之前在知乎上的一个回答搬了过来。题目链接:hash tree 在apriori 算法中是如何进行支持度计数? 我的回答如下:基本上看懂了,所以来答一发。我认为这本书写得很好,数据挖掘入门首选。P211中图6-9就是用Hash方法枚举事务t={1,2,3,5,6}的3-项集,这个图应该很好理解。P212中图6-11其实是作者举的一个例子:此图为一个Hash树...原创 2018-05-08 13:01:59 · 8529 阅读 · 4 评论 -
一些用于聚类和分类问题的数据集
毕业设计时简单研究了聚类和分类问题,整理了一下用到的数据集,有需要的可以参考一下。。。聚类数据集信息 序号 数据集 记录数 特征数 类别 简单分布 是否有overlap 来源 1 iris 150 4 3 50/50/50 No UCI 2 wine 178 13 3 59/71/48 ...原创 2018-08-13 15:02:57 · 64561 阅读 · 20 评论