构建机器学习系统------摘抄

错误选择

这里写图片描述

这里写图片描述

特征工程

归一化

这里写图片描述

这里写图片描述

特征融合

这里写图片描述

特征选择

搜寻最佳参数

这里写图片描述
这里写图片描述
这里写图片描述

模型评估 + 调整

交叉验证!!!

理论

这里写图片描述
这里写图片描述

k折

这里写图片描述

高方差,高偏差

这里写图片描述
这里写图片描述

过拟合处理方法

L1惩罚,L2惩罚

这里写图片描述
这里不仅仅是回归,只是此时正在讲ols(最小二乘)回归,碰巧而已,忽视“回归”二字即可。。。
这里写图片描述
这里写图片描述
这里写图片描述
这里写图片描述这里写图片描述

精度-回归曲线

这里写图片描述

在训练和测试数据不均衡的情况下,为什么要查看准确率和召回率,而不仅仅看正确率???

样本类别不均匀(包含情感的推文比中性的推文少得多)
这里写图片描述

F分数

这里写图片描述这里写图片描述

问题分析

这里写图片描述

模型

逻辑回归

这里写图片描述

LASSO 回归 和 岭回归 和弹性网回归

(一个是对线性回归做了 L1惩罚,一个是对线性回归做了L2惩罚,最后一个既有L1,又有L2)具体看上面关于L1,L2的介绍
实现
这里写图片描述

集成学习

这里写图片描述

skearn 库的内容

这里写图片描述
这里写图片描述
collections讲解,可以提供其他作用的数据类型
auc表示求精度-召回曲线下的面积

python函数讲解

with open … as f :的使用

其实with open(路径) as f : 就是用open打开路径的文件,并将文件对象赋给f,由于with可以自动的检查前后文异常,且可以自动的关闭文件close(),所以其特性很好。见资料

map() 函数的使用

很简单,第一个参数接收一个函数名,第二个参数接收一个可迭代对象。即用第一个参数(是一个函数),不断的去处理 第二个参数(第二个参数是可迭代的),返回的迭代计算的结果


 lr=logistic()
 p=map(lr.predict,x)
 # 返回的p就是x的每一行预测的结果

here
here

python 利用 format打印输出

print “asdsadasd:{}”.format(输出)

逆序排序

这里写图片描述

numpy

numpy.ravel() 和 numpy.flattern()

作用都一样, 都是用于将多维数据转化为一维数据。

相关性

这里写图片描述

使用技巧

  1. 如果打印 print a 但是结果发现出来的是对象(或者是个地址),那么可以用
 for i in data:
     print i

这个方法来打印
2.

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值