- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 sklearn的roc_curve()函数分析
在用sklearn的roc_curve()函数的时候,发现返回的结果和想象中不太一样,理论上threshold应该取遍所有的y_score(即模型预测值)。但是roc_curve()的结果只输出了一部分的threhold。从源码找到了原因。初始数据:y_true = [0, 0, 1, 0, 0, 1, 0, 1, 0, 0]y_score = [0.31689620142873609,...
2018-02-23 18:40:14 27408 13
原创 云硬盘快照数据丢失问题测试
云硬盘快照数据丢失问题测试问题复现虚机A挂载了一块云硬盘disk A,在挂载状态下对该硬盘中写入数据,如echo > test.txt helloworld;创建云硬盘快照,并基于该快照创建一块新的云硬盘disk B,将disk B挂载到虚机B上;对比发现,disk B中的数据与disk A中不一致,disk B中的test.txt文件内容为空。存在数据丢失问题。文件...
2018-02-08 23:13:18 1700
原创 python字节码分析
Python对不可变序列进行重复拼接操作效率会很低,因为每次都会生成一个新的对象,解释器需要把原来对象中的元素先复制到新的对象里,然后再追加新的元素。但是CPython对字符串操作进行了优化,因为对字符串做+=操作实在是太普遍了。因此,初始化str时会预留出额外的可扩展空间,从而进行增量操作的时候不会有复制再追加的这个步骤。通过字节码研究一下这个过程。>>> s_code = 'a
2018-02-05 19:59:40 1813
原创 列表推导和生成器表达式性能对比
列表推导(list comprehension)可用于生成列表(list)生成器表达式(generator expression)可以用来创建其它任何类型的序列。list在很多场景下被滥用,事实上生成器表达式的性能在很多情况下要优于列表推导。生成器表达式是逐个地生产元素,而不是事先建立一个完整的列表,然后再逐个取出列表元素。测试代码如下:from time import per
2018-02-05 11:59:26 1809
原创 梯度下降法和牛顿法的简单对比
梯度下降法和牛顿法机器学习问题可以分为两类:给定data求model;给定model求解θ" role="presentation">θθ\theta : SGD或BGD(沿一阶方向)Newton(沿二阶方向)BFGS(居于一、二阶方向之间)L-BFGS通过一个例子来对比两种求参算法的区别。问题:求解a" role="presentation">a−−√
2018-02-04 21:02:35 1310
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人