机器学习与数据挖掘
关于机器学习与数据挖掘学习笔记
傲慢的上校
努力做好一个手艺人
展开
-
机器学习之机器学习概念
机器学习有下面几种定义: 机器学习是一门人工智能的科学,该领域的主要研究对象是人工智能,特别是如何在经验学习中改善具体算法的性能。 机器学习是对能通过经验自动改进的计算机算法的研究。 机器学习是用数据或以往的经验,以此优化计算机程序的性能标准。原创 2017-04-06 18:33:43 · 6408 阅读 · 0 评论 -
机器学习之统计分析(2)
前言最近在阿里云数加平台上学习一下机器学习,把学习中整理的资料记录于此,已备查看,以下资料主要是概念解释及应用。相关系数矩阵了解相关矩阵前先了解相关系数。 相关系数的取值范围为[-1,1],当相关系数为1时,表示正相关;当相关系数为-1时,表示负相关;当相关系数为0时,表示不相关。 正相关:因变量随着自变量的增大而增大 负相关:因变量随着自变量的增大而减小计算公式:相关矩阵原创 2017-03-28 14:41:35 · 3560 阅读 · 4 评论 -
机器学习之统计分析(1)
数据视图大数据通用可视化控件,提供所选择字段的直方图,如下图所示:协方差相关系数算法用于计算一个矩阵中每一列之间的协方差 (变化趋势相同,协方差为正,变化趋势相反,协方差为负,如果相互独立,则数值为0,但数值为0,不一定是相互独立)协方差矩阵计算的是不同维度之间的协方差原创 2017-03-27 18:23:55 · 3128 阅读 · 0 评论 -
机器学习 特征工程之特征选择
在机器学习和统计学中,特征选择 也被称为变量选择、属性选择 或变量子集选择 。它是指:为了构建模型而选择相关特征(即属性、指标)子集的过程。在机器学习中,每个特征对于目标类别的影响并不相同,所以需要从特征集中挑选出一组最具统计意义的特征子集,把其他无用数据删掉,达到降维的目的。原创 2017-03-25 11:20:16 · 6772 阅读 · 9 评论 -
数加平台 Quick BI 填坑之地理位置信息转换问题
阿里云 数加平台, Quick BI 做报表 仪盘表 多表联动 地理位置 地理信息 没有数据 数据源 maxCompute原创 2017-03-18 09:25:32 · 3746 阅读 · 0 评论 -
《数据挖掘概念与技术》读书笔记
最近在学习数据挖掘和数据分析相关内容,在很多地方有很多朋友都推荐该书,遂购书一本,以作学习之用,把读书过程中一些习得记录在此,以备查阅。第一章 引论1.1 为什么进行数据挖掘现在的我们生活在一个信息时代,每天都有各种各样大量的数据产生并保存到计算机网络和各种存储设备中,然而如何从这些海量数据中发现有价值信息,并使之转换为有组织的知识,这就是数据挖掘产生的原因。1.1.2 数据挖掘是信息技术的进化随着原创 2017-03-12 23:39:48 · 3354 阅读 · 0 评论