机器学习实战(MachineLearinginAction) 第一章

机器学习包括了计算机科学,工程技术和统计学等多个学科.

attributes(属性)
features(特征)

特征可以是数值型,二值型(真,假),枚举型

训练集(training set)
测试集(test set)

训练样本(training examples)
目标变量(target variable)

分类(classification)
回归(regression)
数值型(numeric value)
有监督学习(supervised learning)
无监督学习(unsupervised learning)
聚类(clustering)
密度估计(density estimation)
降维(dimensionality reduction)

如何选择合适的算法
1.考虑算法的目的
这里写图片描述
2.考虑数据的问题
特征值是离线还是连续,是否存在缺失值,是否存在异常值,特征的频率如何

机器学习步骤
1.收集数据
爬虫,api等
2.清洗数据,异常值,缺失值,使数据符合要求的输入格式
3.训练算法
4.测试算法
5.生产实践

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值