python使用记录

aomaoju6169

于 2019-06-07 21:25:00 发布

阅读量106

点赞数

文章标签： python 开发工具数据结构与算法

原文链接：http://www.cnblogs.com/yvlian/p/10989233.html

版权

指定启动Jupyter notebook的版本

python3.6 -m jupyter notebook时，查看在jupyter notebook内部打印sys,path,发现调用的并不是python3.6，而是python2.7，只能先把python2.7里面的jupyter notebook uninstall。

当评估估计器的超参数时，为什么要设置一个验证集？

在调参时，我们一般调整参数直至估计器达到最优，但是这有可能将测试集中的信息“泄露”给估计器，而且评估指标也不再报告泛化性能。设置验证集可解决这一问题，即在训练集上进行训练，验证集上评估，当实验似乎成功时，在测试集上进行最终评估。

交叉验证优缺点

通常，我们将数据分成3组，这大大减小了可用于学习模型的样本数，浪费数据。使用交叉验证可以解决这一问题，但是计算代价更大。

pipeline

pipeline的输入为一连串的数据挖掘步骤，其中最后一步必须是估计器（Estimator），可理解成分类器前几步是转换器（Transformer）。输入的数据集经过转换器的处理后，输出的结果作为下一步的输入,使得编写估计器更容易，在交叉验证下提供此行为：

>>> from sklearn.pipeline import make_pipeline

>>> clf = make_pipeline(preprocessing.StandardScaler(),PCA(n_components=2),svm.SVC(C=1))

>>> cross_val_score(clf, iris.data, iris.target, cv=cv)

去重后,依据原来列表的顺序进行排序

a = [1,1,4,5,2,2,9,9]
m = list(set(a))

m.sort(key=a.index)

转载于:https://www.cnblogs.com/yvlian/p/10989233.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python使用记录

指定启动Jupyter notebook的版本python3.6 -m jupyter notebook时，查看在jupyter notebook内部打印sys,path,发现调用的并不是python3.6，而是python2.7，只能先把python2.7里面的jupyter notebook uninstall。当评估估计器的超参数时，为什么要设置一个验证集？在调参时...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。