初步理解数据挖掘与机器学习

数据挖掘的基本步骤为以下几种:

读取数据:爬虫

异常检测:在将数据收集整理后按正态分布模型,借助数据可视化工具的帮助可以划分一个正常范围以及极端取值范围

关联分析:通过对数据的分析找到变量之间的关联,建立函数模型。例如超市购物中购物车为一变量,不同商品为不同变量,如果在“购物车”中同时具有“面包” “牛奶” 两个变量的情况可以预测该购物者会趋向于“酸奶”变量,这便是一种关系

聚类:在未知数据结构的情况下利用相似性原则将一类相似样本区分

分类:在聚类的基础上建立具体函数(划分标准)将样本区分

回归:统计数据,利用回归曲线进行分析,找出最小误差的拟合函数,并利用该函数进行分析预测

机器学习:

不同于人工智能,人工智能指通过不断的神经网络学习,使得机器能发展出类似人的思维能力,对于机器学习其实类似于数据挖掘的步骤,只不过具体步骤由海量数据训练成的机器模型处理,所以机器学习的根本在于不断的模仿,和人类学习知识的方式很类似,不断重复。目前熟知的"alaphago""深蓝"其实应该算为机器学习,这两个模型都是在基于对博弈论的算法不断优化上进行的。真正的人工智能是《钢铁侠》中 贾维斯 的存在,是利用数据和模型去解决现有问题,但具体实现可能还有一点距离

具体步骤也是积累数据,但是建议进行数据可视化分析,建立相对应的函数模型,并且每一段学习过后对于其分类数据出现的误差进行纠正,最后是对于机器学习成功进行检验。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值