机器学习入门到精通

1、训练模型:将训练集数据,代入算法进行运算,然后不断调整参数,使运算结果和实际结果相同(近似),得到的参数代入原来的算法,得到的算法就是模型。
核心思想就是数学上的:根据某些数据,求得参数,得到的参数后的整个数学公式就是模型
2、特征工程:特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优(或者接近最佳性能)
http://blog.csdn.net/buptdavid/article/details/49996345
3、XGBoost是2014年2月诞生的专注于梯度提升算法的机器学习函数库,XGBoost不仅学习效果很好,而且速度也很快,相比梯度提升算法在另一个常用机器学习库scikit-learn中的实现,XGBoost的性能经常有十倍以上的提升。
由于梯度提升树非常受欢迎,目前有非常多的实现库,包括 scikit-learn、R gbm、Spark MLLib、LightGBM和 XGBoost等。
所以综上,每个函数库(实现庫)比如xgboost和tensorflow对算法的实现,封装,使用方式都是不相同的。
xgboost和tensorflow都有对梯度提升算法的实现,只不过xgboost是比较专一于梯度提升这方面。而tensorflow是一个包含了很多算法的实现庫。
4、拟合:拟合就是把平面上一系列的点,用一条光滑的曲线连接起来。因为这条曲线有无数种可能,从而有各种拟合方法。拟合的曲线一般可以用函数表示
5、期望:期望值,即平均值,
6、方差:统计中的方差(样本方差)是每个样本值与全体样本值的平均数之差的平方值的平均数。研究方差即偏离程度有着重要意义。
7、决策树模型。决策树模型是一类算法的集合,比如生成决策树的算法有:ID3,C4.5和CART算法
8、回归和分类

  • · 分类问题是指,给定一个新的模式,根据训练集推断它所对应的类别(如:+1,-1),是一种定性输出,也叫离散变量预测;
  • · 回归问题是指,给定一个新的模式,根据训练集推断它所对应的输出值(实数)是多少,是一种定量输出,也叫连续变量预测。

举个例子:预测明天的气温是多少度,这是一个回归任务;预测明天是阴、晴还是雨,就是一个分类任务。
9、Apriori关联规则算法:https

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值