机器学习与数据挖掘
junli_chen
这个作者很懒,什么都没留下…
展开
-
缺失值的处理方法
转载自http://blog.sina.com.cn/s/blog_670445240102v08m.html 对于数据挖掘和分析人员来说,数据准备(Data Preparation,包括数据的抽取、清洗、转换和集成)常常占据了70%左右的工作量。而在数据准备的过程中,数据质量差又是最常见而且令人头痛的问题。本文针对缺失值和特殊值这种数据质量问题,进行了初步介绍并推荐了一些处理方法转载 2016-01-21 20:09:30 · 3632 阅读 · 0 评论 -
非常好的理解遗传算法的例子
遗传算法的手工模拟计算示例为更好地理解遗传算法的运算过程,下面用手工计算来简单地模拟遗传算法的各 个主要执行步骤。 例:求下述二元函数的最大值: (1) 个体编码 遗传算法的运算对象是表示个体的符号串,所以必须把变量 x1, x2 编码为一种 符号串。本题中,用无符号二进制整数来表示。原创 2016-01-21 20:34:10 · 334 阅读 · 0 评论 -
数据挖掘算法之离散化和二元化
转载自:http://deepfuture.iteye.com/blog/1395669离散化和二元化有些数据挖掘算法,特别是某些分类算法,要求数据是分类属性形式。发现关联模式的算法要求数据是二元属性形式。这样,常常需要将连续属性变换成分类属性(离散化,discretization),并且连续和离散属性可能都需要变换成一个或多个二元属性(二元化,binariza转载 2016-01-21 20:35:02 · 6001 阅读 · 0 评论 -
一篇关于机器学习的温和指南
机器学习是人工智能的一个分支,它通过构建算法让计算机学习,并且在数据集上使用这些算法来完成任务,而不需要进行明确编码。明白了吗?我们可以让机器去学习如何做事情!当我第一次听到它的时候,让我非常兴奋。那意味着我们可以对计算机进行编码,让它们自己去学习东西!学习的能力是智能最重要的一个方面。将这种能力运用到机器上,应该是向让计算机更智能迈出了一大步。事实上,机器学习是如今人工智能领域中转载 2016-01-21 20:37:02 · 536 阅读 · 0 评论 -
机器学习与数据挖掘网上资源搜罗——良心推荐
前面我曾经发帖推荐过网上的一些做“图像处理和计算机视觉的”有料博客资源,原帖地址图像处理与机器视觉网络资源收罗——倾心大放送http://blog.csdn.net/baimafujinji/article/details/32332079做机器学习和数据挖掘方面的研究和开发,常会在线搜索一些资源,日积月累便挖出了一堆比较牛的博主,特别说明:做这个方向的转载 2016-01-09 21:17:44 · 515 阅读 · 0 评论 -
python实现的遗传算法实例(一)
一、遗传算法介绍 遗传算法是通过模拟大自然中生物进化的历程,来解决问题的。大自然中一个种群经历过若干代的自然选择后,剩下的种群必定是适应环境的。把一个问题所有的解看做一个种群,经历过若干次的自然选择以后,剩下的解中是有问题的最优解的。当然,只能说有最优解的概率很大。这里,我们用遗传算法求一个函数的最大值。 f(x) = 10 * sin( 5x ) + 7原创 2016-01-28 14:52:06 · 5581 阅读 · 3 评论 -
如何进行舆情预测
随着国际地位的不断上升,中国日益走在了全球舆情的风口浪尖,如何发挥正面舆情的积极效果,将负面舆情引向正面效果的轨道,已显得越来越重要。尤其是互联网这把“双刃剑”,在提供大量进步、健康、有益的提倡性信息的同时,也有不少反动、迷信、低级的误导性言论,这就突出了舆情预测的重要性。 那么,应该如何进行舆情预测呢? 一、舆情预测的可行性分析 既然是可行性分析,那就说明这种分原创 2016-04-13 10:10:33 · 3315 阅读 · 0 评论