数据挖掘
文章平均质量分 67
多肽
这个作者很懒,什么都没留下…
展开
-
10月11日数据挖掘课堂笔记完善
10.11社会学什么是社会问题社会问题是由于社会关系或社会环境失调,致使人类全体(如人口过多、环境破坏、战争)、国家整体(如社会保障缺失、失业、贫富悬殊、歧视)或相当一部分成员(如家庭暴力、霸凌、性侵害)的共同生活受到不良影响,社会进步发生障碍并需要运用社会力量才能加以解决的社会现象影响相当数量的人,违背社会主导价值和规范的客观事实,社会问题的产生与人的道德有关,同时社会问题可以改变。...原创 2018-10-11 23:21:55 · 206 阅读 · 0 评论 -
数据挖掘引入
数据挖掘的内容KDD(Knowledge Discovery in Database):从数据中发现有用知识。数据挖掘(DM)被认为是KDD过程中的一个特定步骤。数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。KDD,CRISP-DM,SEMMA模型对比KDD过程模型K...原创 2018-09-27 14:40:37 · 579 阅读 · 0 评论 -
《数文明》
量数:传统意义上的数据,即人类对事物进行测量的结果,关键是精确据数:源于对周围环境的记录是一种证据、根据,如照片、视频、音频。关键在于清晰地“留据”。目前以据数为中心的大数据讨论主要停留在一下就几个方面1、精准营销,即互联网广告业;2、商业和社会信用:如芝麻信用,先记录消费者信用,然后在后期从中获利;3、隐私问题。文字只是数据的一个子集。数惧普适记录:每个人都可以用一部手机录...原创 2018-10-19 21:04:08 · 974 阅读 · 0 评论 -
决策树
决策树大佬们的总结more details一、 决策树生成的重要问题数据如何分割:离散型按属性值分,连续型按区间分如何选择分裂的属性:找出能够使所有孩子节点数据最纯的属性(指标:信息增益,信息增益率)什么时候停止分裂熵熵描述了数据的混乱程度,熵越大,混乱程度越高,也就是纯度越低;熵的计算公式如下所示:Entropy=−∑i=1npi⋅log(pi),Entropy=-\su...原创 2018-11-16 10:39:08 · 183 阅读 · 0 评论