- 博客(9)
- 资源 (2)
- 收藏
- 关注
原创 《Machine Learning Yearning》Note11-When to change dev/test sets and metrics
概要 当开始一个新的项目时,我尝试快速地选择dev/test 集合,因为这可以使我们的目标更明确。 ——Andrew Ng 这一节介绍了我们在什么时候需要更换验证集/测试集,笔记主要记录了两点。 Ng建立新项目时的做法: 快速地选择初始dev/test集合(小于一周时间), 不要求一开始就很完美,要快速向前,而不是反复思考用什么验证集/测试集,当然不用于成熟的应用。 之后如果意识到初始的验...
2019-03-24 18:54:26 381
原创 《Machine Learning Yearning》Note10-Having a dev set and metric speeds up iterations
概要 针对一个新问题,我们我们会有很多的想法,然而我们很难提前知道哪种方法最好。对于这个问题,解决办法就是使用验证集和度量。 Ng介绍了他建立一个机器学习系统的迭代步骤(通常第一个想法是无效的): 如何建立系统的想法 用代码实现想法 用实验验证想法的效果 如果能快速地实现上述流程的迭代,那么就会更快地取得进步,验证集和度量能使得我们快速判断方向是否正确。 例子 Ng介绍了一个反例,如果开...
2019-03-24 17:48:03 145
原创 《Machine Learning Yearning》 Note9---Optimizing and satisficing metrics
1. 内容 这一节主要讲了在有多个评价指标时,如何优化算法,或者如何将多个评价指标结合起来(combine multiple evaluation metrics)。例如,在一个系统中,我们需要既考虑准确度又要考虑学习算法的运行时间,面对两个评价标准,一个不太自然的方法是从它们(准确率和运行时间)派生出一个综合评价指标,如: Accuracy - 0.5 * RunningTime。 另一种方法也...
2019-03-17 17:32:08 122
原创 《How to be a Programmer》读书笔记——性能问题
性能问题 性能的好坏一般体现在系统运行所产生的开销。客户需要或市场竞争使得我们需要提高系统的性能,但是如何把系统变快呢?首先我们必须去弄清楚真正花费时间或资源的地方。 90%的时间会花费在10%的代码上。 文中提到“通常大部分时间是以某种形式花费在I/O上。” 我们可以从发现这些昂贵的I/O和这些10%的代码开始去构建一个关于时间消耗的思维模型(图表工具或日志)。 计算机系统的性能有很多个维...
2018-10-30 19:54:39 201
原创 《How to be a Programmer》笔记——学会Debug
《How to be a Programmer》笔记——学会Debug 学会Debug 对于程序员来说,Debug可以说是家常便饭,我们写的程序不是完美的,它们或有明显的错误或隐藏的错误,总之,我们需要修复错误,就离不开Debug,可到底什么是Debug, 如何去Debug呢? Debug中文译作调试,程序发生了一个错误,你却不知道哪里有问题导致这个错误,这就需要你执行代码并且在这个过程中观察到内...
2018-10-11 20:15:28 213
原创 求数组中第k个最大(小)的数,或k个最大(小)的数
目录 用 [TOC]来生成目录: 目录 题目描述 解题思路 代码 题目描述 Kth Largest Element in an Array(leetcode 215) Find the kth largest element in an unsorted array. Note that it is the kth largest element ...
2018-07-06 16:16:01 673
原创 python 绘制 heatmap
1. colormap Python提供了各种各样的colormap, 有三类: 亮度连续变化(Sequence), 亮度不连续(Diverging), 定性的,颜色之间没有次序(Qualitative)。 2. 将数据矩阵的数值映射到颜色,可以采用matplotlib.pyplot中的imshow函数,当然你首先需要colormap,像如下这样: {CSDN:CODE:257688
2018-06-01 15:17:17 7193
原创 Github 使用教程
一、创建本地文件夹 在某个想要创建版本库的目录下新建一个版本库(文件夹)。 打开这个文件夹,可通过pwd命令显示其所在路径。 git init 命令把这个目录变成git可以管理的仓库。 把文件添加到版本库中。 git add 文件名: 将文件添加到暂存区中。 git commit:把文件提交到仓库。 git status 查看文件提交的状态,和是否被修改 git diff 文件名:查...
2018-03-16 10:26:00 188
原创 PCA(Principal Components Analysis)
1、算法步骤1)数据预处理---数据归一化处理 1-2步使得数据集的均值为0,3-4步将每个方差重新调整到单位方差。保证数据不同属性的数据规模相同。如果不同属性的数据规模相同,3-4步可以忽略。2)在均值归一化和可选的特征scaling后2、数学上的理解 我们想要将数据降维,例如从将某个向量从n维降到k维,我们需要找到一个空间中的k个方向,使得该向量投影到这k个方向上的值的方差到达最...
2017-02-28 17:43:54 286
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人