吴恩达机器学习课程
文章平均质量分 93
lk小强
水滴穿石,一步一个脚印成长为大神
展开
-
吴恩达-coursera-机器学习-week1
吴恩达-coursera-机器学习-week1机器学习是什么?参考视频: 1 - 2 - What is Machine Learning_ (7 min).mkv机器学习是什么?在本视频中,我们会尝试着进行定义,同时让你懂得何时会使用机器学习。实际上,即使是在机器学习的专业人士中,也不存在一个被广泛认可的定义来准确定义机器学习是什么或不是什么,现在我将告诉你一些人们尝试定义的示例。第一个机器学习...原创 2018-07-09 16:07:06 · 916 阅读 · 0 评论 -
机器学习编程作业(exe6)总结
在本练习的前半部分,您将使用具有各种示例2D数据集的支持向量机(SVM)。 对这些数据集进行实验将有助于您直观地了解SVM如何工作以及如何在SVM中使用高斯核函数。 作业所提供的脚本ex6.m将帮助您逐步完成练习的前半部分。 %% Initializationclear ; close all; clc%% =============== Part 1: Loading and Vi...原创 2018-08-06 21:13:35 · 472 阅读 · 0 评论 -
机器学习编程作业(exe5)总结
参考博文CheeseZH: Stanford University: Machine Learning Ex5:Regularized Linear Regression and Bias v.s. Variance (1) plot the training data:%% Initializationclear ; close all; clc%% ========...原创 2018-08-02 14:59:41 · 692 阅读 · 0 评论 -
吴恩达-coursera-机器学习测试题第十六章-推荐系统
2. In which of the following situations will a collaborative filtering system be the most appropriate learning algorithm (compared to linear or logistic regression)?You've written apiece of softw...原创 2018-08-14 21:10:24 · 1034 阅读 · 0 评论 -
吴恩达-coursera-机器学习测试题第十三章-聚类
解析:K均值算法只能将数据分类开,并不能具体分成哪些类,所以诸如垃圾软件、晴天雨天都是无法分出的,将文章主题划分成几类,还能将网站用户划分几类,故选择AD集的算法,就被称为聚类算法 解析:应该是x(i)与u(i)距离最短的点所以选择D才对,因为u3离x(i)最近u1,u2,u3与x(i)距离最短的事u1,c(i)存储于第i个实例最近的聚类中心的索引,故为...原创 2018-08-08 11:15:57 · 1109 阅读 · 0 评论 -
吴恩达-coursera-机器学习测试题第十五章-异常检测
解析:异常值检测分析数据将明显区别于正常值的数据挑选出来,AB符合,CD是分类 什么是异常检测异常检测是检测不符合期望的数据、行为,在实际应用中包括去噪、网络入侵检测、欺诈检测、设备故障检测、机会识别、风险识别、特殊群体识别、患病诊断、视频监测等。异常检测通过对输入数据进行分析,检测异常状态。输入数据类型包括:连续型、二值型、类别型、图、时空数据、图像、音频等,输出异常事件或者异...原创 2018-08-13 22:36:46 · 818 阅读 · 0 评论 -
机器学习编程作业(exe8)总结
在本练习中,您将实施异常检测算法并将其应用于检测网络上发生故障的服务器。 在第二部分中,您将使用协作过滤来构建电影的推荐系统1异常检测 在这个练习中,您将实现一个异常检测算法来检测服务器计算机中的异常行为。 这些功能衡量每个服务器响应的吞吐量(mb / s)和延迟(ms)。 当你的服务器正在运行时,你收集了他们如何行为的例子,因此有一个未标记的数据集{x(1),…,x(m)}。 您怀疑这些示...原创 2018-08-17 10:46:31 · 711 阅读 · 0 评论 -
吴恩达-coursera-机器学习测试题第十七章-大规模机器学习
1.选择:B解析:由于代价函数上升了,所以应该减少学习速率,选择B A并不需要代价函数总是减少,只是可能会降低 故错误。B在运行随机梯度下降算法前最好将样本打乱随机化,正确。C也就随机的优点正确。D并行可不是随机的优点,是映射约减的优点,故错误。 3.选择:CD解析:A并不一定需要大量的存储空间,如果有连续的大量的数据就不用存储所有数据,故错误。B在线学...原创 2018-08-17 16:07:51 · 461 阅读 · 0 评论 -
吴恩达-coursera-机器学习测试题第十八章-应用实例:图片文字识别
1.选择:C解析:1000*1000大小,每次移动步长2像素,所以总共是500*500=250000次滑动,两个就是500000次滑动。 2.选择:C解析:小学数学应用题。1000个数据 / 4*60 = 4.17 需要4个小时 每个小时10 当1000条数据,就是400美元大概。 3.选择:AD 解析:AD就是上限分析的作用所在,B是学习曲线...原创 2018-08-17 20:55:55 · 323 阅读 · 1 评论 -
修改 jupyter notebook 启动工作路径的方法
Windows下jupyter notebook默认的启动路径就是当前cmd启动jupyter 的路径:这里需要注意转换路径时候,需要小写,才能读到c根目录下这样即可打开编辑器 此时jupyter 的启动工作路径就是在 c:\Users\用户名,当更改盘符或者文件夹路径时 jupyter 的启动也会随着改变,为了使每次都在一个指定的工作路径下打开,可按如下设置:1.打开...原创 2018-08-31 21:37:16 · 12583 阅读 · 4 评论 -
为什么梯度反方向是函数值下降最快的方向?
面试遇到的问题:刚接触梯度下降这个概念的时候,是在学习机器学习算法的时候,很多训练算法用的就是梯度下降,然后资料和老师们也说朝着梯度的反方向变动,函数值下降最快,但是究其原因的时候,很多人都表达不清楚。所以我整理出自己的理解,从方向导数这个角度把这个结论证明出来,让我们知其然也知其所以然~参考在梯度下降法中,为什么梯度的负方向是函数下降最快的方向?为什么梯度反方向是函数值下降最快的方向?进行整...原创 2018-09-18 15:17:35 · 9930 阅读 · 4 评论 -
唐宇迪机器学习实战——交易数据异常检测
import pandas as pdimport matplotlib.pyplot as pltimport numpy as np%matplotlib inlinedata = pd.read_csv("creditcard.csv")data.head()# 数据有31列:Time、V1-V28、Amount和Class,注意到最后一列Class,这是我们的label值,...原创 2018-09-25 20:54:49 · 1106 阅读 · 3 评论 -
预处理数据的方法总结(使用sklearn-preprocessing)
预处理数预处理数据的方法总结(使用sklearn-preprocessing)当我们拿到一批原始的数据首先要明确有多少特征,哪些是连续的,哪些是类别的。 检查有没有缺失值,对确实的特征选择恰当方式进行弥补,使数据完整。 对连续的数值型特征进行标准化,使得均值为0,方差为1。 对类别型的特征进行one-hot编码。 将需要转换成类别型数据的连续型数据进行二值化。 为防止过拟合或...原创 2018-09-20 21:07:14 · 103419 阅读 · 6 评论 -
唐宇迪机器学习实战——梯度下降求解逻辑回归(理论基础+源代码实现)
问题的提出符号问题,这里的lg就是指log2,你的理解是正确的!在计算机科学中有些符号的使用跟我们在数学中使用的有区别。比如有时候log用来表示自然对数(以e为底数)。希望对你有帮助!首先计算机科学里的lgn就是数学上的log2(n)现要实现一个简单的线性回归:我们将建立一个逻辑回归模型来预测一个学生是否被大学录取。假设你是一个大学系的管理员,你想根据两次考试的结果来决定每个申请人...原创 2018-09-21 22:45:36 · 2394 阅读 · 2 评论 -
win10 64位 安装Anaconda+TensorFlow+配置PyCharm
win10 64位 安装Anaconda+TensorFlow+配置PyCharm第一步:官网:https://www.continuum.io/downloads 目前官网是5.0我用的是Anaconda3-5.2.0-Windows-x86_64安装步骤参考:win7 64位 安装Anaconda+TensorFlow+配置PyCharm安装完毕后,点击开始按钮,找到如下,点击图标...原创 2018-10-05 10:43:15 · 3823 阅读 · 0 评论 -
机器学习编程作业(exe7)总结
exercise 7 —— K-means and PCA在此下载Coursera-吴恩达-机器学习-全部编程练习答案在本练习中,您将实现K均值聚类算法并将其应用于压缩图像。 在第二部分中,您将使用主成分分析来查找面部图像的低维表示。1 K-means先从二维的点开始,使用K-means进行分类。 K-means步骤如上,在每次循环中,先对所有点更新分类,再更新每一类的中心坐标。...原创 2018-08-11 10:22:13 · 473 阅读 · 0 评论 -
吴恩达-coursera-机器学习测试题第十章
========= 关于偏差、方差以及学习曲线为代表的诊断法 ==========(一)模型选择Model selection在评估假设函数时,我们习惯将整个样本按照6:2:2的比例分割:60%训练集training set、20%交叉验证集cross validation set、20%测试集test set,分别用于拟合假设函数、模型选择...原创 2018-08-01 17:09:14 · 2180 阅读 · 0 评论 -
吴恩达-coursera-机器学习测试题第十四章-降维
1.选择AB解析:u(1)的选择应该是使投影距离最短,而向量的方向正负皆可,故选择AB 2.选择B 解析:k的选择与m无关,肘方法适用于聚类类数的选择。k的选择应该是在满足差异性的情况下,取最小的值。故选择B。 3.选择B解析:对照公式选择即可。这里是直接的(式子)<0.05,后面使用svd中得到的Sii是(1-另一个式子)<0.05。...原创 2018-08-10 09:25:17 · 432 阅读 · 0 评论 -
吴恩达-coursera-机器学习-week2
二、单变量线性回归(Linear Regression with One Variable)2.1 模型表示参考视频: 2 - 1 - Model Representation (8 min).mkv我们的第一个学习算法是线性回归算法。在这段视频中,你会看到这个算法的概况,更重要的是你将会了解监督学习过程完整的流程。让我们通过一个例子来开始:这个例子是预测住房价格的,我们要使用一个数据集,数据集包...原创 2018-07-12 08:38:56 · 732 阅读 · 0 评论 -
吴恩达-coursera-机器学习易错题前三周
标准化下 :( - (89+72+94+69)/4)/(94-69)=0.52所以逻辑回归的代价函数总是大于等于0第三周正则化:原创 2018-07-27 21:28:57 · 764 阅读 · 0 评论 -
win7 64位 安装Anaconda+TensorFlow+配置PyCharm
第一步:官网:https://www.continuum.io/downloads 目前官网是4.3 千万别手贱去下载,打开,找到4.2版本 我用的是Anaconda3-5.1.0-Windows-x86_64 安装过程参考:在“Welcome to Anaconda3 5.0.0 (64-bit) Setup”界面单击“Next”按钮 在“License Agre...原创 2018-07-12 22:31:28 · 2807 阅读 · 0 评论 -
Coursera吴恩达机器学习课程-第五章
五、Octave教程(Octave Tutorial)5.1 基本操作参考视频: 5 - 1 - Basic Operations (14 min).mkv在这段视频中,我将教你一种编程语言:Octave语言。你能够用它来非常迅速地实现这门课中我们已经学过的,或者将要学的机器学习算法。过去我一直尝试用不同的编程语言来教授机器学习,包括C++、Java、Python、Numpy和Oc...原创 2018-07-17 23:14:16 · 3150 阅读 · 0 评论 -
机器学习编程作业(exe3)总结
Andrew Ng coursera上的《机器学习》ex3按照课程所给的ex3的文档要求,ex3要求完成以下几个计算过程的代码编写:exerciseName description IrcostFunction.m logistics regression cost function oneVSall.m train one-vs-all muti-class c...原创 2018-07-28 16:54:15 · 1753 阅读 · 0 评论 -
矩阵求导公式
基本公式:Y = A * X --> DY/DX = A'Y = X * A --> DY/DX = AY = A' * X * B --> DY/DX = A * B'Y = A' * X' * B --> DY/DX = B * A'1. 矩阵Y对标量x求导:相当于每个元素求导数后转置一下,注意M×N矩阵求导后变成N×M了Y = [y(ij)] --...原创 2018-07-27 08:33:59 · 425 阅读 · 0 评论 -
MATLAB常见知识-std函数
std函数是用来计算标准偏差的一个函数,由于其有不同的参数,我们就用下面的例子进行介绍:A = 1 2 3 1 1 1标准差的两种计算公式如下: std(A): std(A)函数求解的是最常见的标准差,此时除以的是N-1。 注意:此函数命令不能对矩阵求整体的标准差,只能按照行或者列进行逐个求解标准差,默认情...原创 2018-07-27 09:17:57 · 17959 阅读 · 0 评论 -
吴恩达-coursera-机器学习测试题第五周
如果我们使用梯度下降作为我们的优化算法,那么梯度检查是很有用的。但是,如果我们使用的是高级优化方法之一(比如fminunc),它几乎没有什么作用。 假设我们有一个正确的反向传播的实现,并且使用梯度下降来训练一个神经网络。假设我们把J(Theta)J()作为迭代次数的函数,并且发现它是递增的而不是递减的。一个可能的原因是,学习速率太大了。 ...原创 2018-07-30 15:47:15 · 4660 阅读 · 0 评论 -
机器学习编程作业(exe1)总结
本博客内容是对Coursera上Andrew Ng的《机器学习》的编程作业的总结,本博文是在Matlab基础上对第一次编程作业的总结,随后的博文会对所有的编程作业进行一一总结。 本博文主要对作业中需要实现的代码进行讲解。 脚本文件ex1.m用来执行单变量线性回归,ex1_multi.m用来执行多变量线性回归。在这里先看ex1.m中的代码。单变量线性回归%% Initial...原创 2018-07-27 14:29:45 · 854 阅读 · 0 评论 -
吴恩达-coursera-机器学习测试题第十一章
==============================第二讲===================================== 机器学习系统的设计 ====== (一)机器学习系统的设计流程Step1.使用快速但不完美...原创 2018-08-04 14:26:58 · 1769 阅读 · 0 评论 -
机器学习编程作业(exe4)总结
%% Initializationclear ; close all; clc%% Setup the parameters you will use for this exerciseinput_layer_size = 400; % 20x20 Input Images of Digitshidden_layer_size = 25; % 25 hidden unitsn...原创 2018-07-31 11:13:51 · 369 阅读 · 0 评论 -
机器学习编程作业(exe2)总结
一. 逻辑回归 1.背景:使用逻辑回归预测学生是否会被大学录取。数据集:34.62365962451697,78.0246928153624,030.28671076822607,43.89499752400101,035.84740876993872,72.90219802708364,060.18259938620976,86.30855209546826,179.03...原创 2018-07-27 21:27:42 · 849 阅读 · 2 评论 -
吴恩达-coursera-机器学习测试题第四周
原因是:在神经网络中隐藏单元的激活值,在每一层都应用了sigmoid激活函数,总是在范围内(0,1)。 前向传播算法: ...原创 2018-07-28 14:17:27 · 4298 阅读 · 0 评论 -
吴恩达-coursera-机器学习测试题第十二章-支持向量机
不太能理解为什么C需要大一点??? 解析:SVM欠拟合,高偏差 原来要调整lambda减少,而C=1/lambda,所以就要调整C增加,减少平方项。 解析:由于只减少了平方项,所以fi的位置不变,只是整个图像变窄了。 解析:使第一项为零,必须保证cost1或者cost0的函数为零,则y=1时看cost1,要使z=thetaTx>=1才能让co...原创 2018-08-06 15:18:59 · 632 阅读 · 0 评论 -
OneHotEncoder独热编码和LabelEncoder标签编码
OneHotEncoder独热编码学习sklearn和kagggle时遇到的问题,什么是独热编码?为什么要用独热编码?什么情况下可以用独热编码?以及和其他几种编码方式的区别。 首先了解机器学习中的特征类别:连续型特征和离散型特征。 拿到获取的原始特征,必须对每一特征分别进行归一化,比如,特征A的取值范围是[-1000,1000],特征B的取值范围是[-1,1].如果使用log...原创 2018-09-22 14:51:20 · 13602 阅读 · 2 评论