错误选择
特征工程
归一化
特征融合
特征选择
搜寻最佳参数
模型评估 + 调整
交叉验证!!!
理论
k折
高方差,高偏差
过拟合处理方法
L1惩罚,L2惩罚
这里不仅仅是回归,只是此时正在讲ols(最小二乘)回归,碰巧而已,忽视“回归”二字即可。。。
精度-回归曲线
在训练和测试数据不均衡的情况下,为什么要查看准确率和召回率,而不仅仅看正确率???
样本类别不均匀(包含情感的推文比中性的推文少得多)
F分数
问题分析
模型
逻辑回归
LASSO 回归 和 岭回归 和弹性网回归
(一个是对线性回归做了 L1惩罚,一个是对线性回归做了L2惩罚,最后一个既有L1,又有L2)具体看上面关于L1,L2的介绍
实现
集成学习
skearn 库的内容
collections讲解,可以提供其他作用的数据类型
auc表示求精度-召回曲线下的面积
python函数讲解
with open … as f :的使用
其实with open(路径) as f : 就是用open打开路径的文件,并将文件对象赋给f,由于with可以自动的检查前后文异常,且可以自动的关闭文件close(),所以其特性很好。见资料
map() 函数的使用
很简单,第一个参数接收一个函数名,第二个参数接收一个可迭代对象。即用第一个参数(是一个函数),不断的去处理 第二个参数(第二个参数是可迭代的),返回的迭代计算的结果
lr=logistic()
p=map(lr.predict,x)
# 返回的p就是x的每一行预测的结果
python 利用 format打印输出
print “asdsadasd:{}”.format(输出)
逆序排序
numpy
numpy.ravel() 和 numpy.flattern()
作用都一样, 都是用于将多维数据转化为一维数据。
相关性
使用技巧
- 如果打印 print a 但是结果发现出来的是对象(或者是个地址),那么可以用
for i in data:
print i
这个方法来打印
2.