sklearn的roc_curve()函数分析

在用sklearn的roc_curve()函数的时候,发现返回的结果和想象中不太一样,理论上threshold应该取遍所有的y_score(即模型预测值)。但是roc_curve()的结果只输出了一部分的threhold。从源码找到了原因。 初始数据: y_true = [0, 0, 1, 0...

2018-02-23 18:40:14

阅读数 6734

评论数 1

云硬盘快照数据丢失问题测试

云硬盘快照数据丢失问题测试 问题复现 虚机A挂载了一块云硬盘disk A,在挂载状态下对该硬盘中写入数据,如echo > test.txt helloworld; 创建云硬盘快照,并基于该快照创建一块新的云硬盘disk B,将disk B挂载到虚机B上; 对比发现,...

2018-02-08 23:13:18

阅读数 787

评论数 0

python字节码分析

Python对不可变序列进行重复拼接操作效率会很低,因为每次都会生成一个新的对象,解释器需要把原来对象中的元素先复制到新的对象里,然后再追加新的元素。 但是CPython对字符串操作进行了优化,因为对字符串做+=操作实在是太普遍了。因此,初始化str时会预留出额外的可扩展空间,从而进行增量操作的...

2018-02-05 19:59:40

阅读数 931

评论数 0

列表推导和生成器表达式性能对比

列表推导(list comprehension)可用于生成列表(list) 生成器表达式(generator expression)可以用来创建其它任何类型的序列。 list在很多场景下被滥用,事实上生成器表达式的性能在很多情况下要优于列表推导。生成器表达式是逐个地生产元素,而不是事先建立一个...

2018-02-05 11:59:26

阅读数 959

评论数 0

梯度下降法和牛顿法的简单对比

梯度下降法和牛顿法 机器学习问题可以分为两类: 给定data求model; 给定model求解θ" role="presentation">θθ\theta : SGD或BGD(沿一阶方向) Newton(沿二阶方向) BFGS(居...

2018-02-04 21:02:35

阅读数 865

评论数 0

提示
确定要删除当前文章?
取消 删除