- 博客(43)
- 资源 (10)
- 收藏
- 关注
原创 Andrew Ng's deeplearning Course5Week3 Sequence models & Attention mechanism
一. 基础模型编码-解码 如图中所示,输入一个法语句子,然后将其转换为英语句子。我们设定一个RNN结构的编码器和解码器,先将输入的法语句子编码为一个向量,再通过解码器将其转换为英语句子。图像描述 图像描述,顾名思义就是给出一幅图片,然后根据图片给出相应的描述。我们将之前RNN中学到的AlexNet结构最后的softmax层去掉,前面的就是类似于一个编码网络,可以将图片编码成一个...
2018-03-20 22:02:57 398
原创 Andrew Ng's deeplearning Course5Week2 Natural Language Processing&Word Embeddings
一.词嵌入介绍1.词汇表征在之前,我们是根据单词在词汇表中的位置来表示单词的(one-hot),而这个方法有一个缺点。 在做如上图所示的迁移学习时,模型没法根据上一句的orange juice而判断得到下面一句apple的后面大概率也是juice。有一种方法能比较好的解决这个问题,那就是特征化的表示方法。 如上图所示,假设每个单词有300维,每一维代表的都是一个特征,里面的...
2018-03-14 23:14:47 706
原创 Andrew Ng's deeplearning Course5Week1 Recurrent Neural Networks(循环神经网络)
一、预备知识1.序列化例子 序列模型可以应用的例子有:语音识别、音乐生成、情感分类、DNA序列分析、机器翻译、视频行为识别、命名实体识别。2.数学符号 如上图所示:x是一行句子。x<t>x<t>x^{}表示第t个输入数据,索引不同的位置,如x<1>x<1>x^{}表示Harry,y<t>y<t>...
2018-03-13 21:17:16 468
原创 Andrew Ng's deeplearning Course 第1课、第2课、第3课、第4课、第5课课后练习题/编程题
吴恩达深度学习deeplearning第一课课后测验及编程作业(含答案):http://download.csdn.net/download/u012867545/10171710吴恩达深度学习deeplearning第二课课后测验及编程作业(含答案):http://download.csdn.net/download/u012867545/10172659吴恩达深度学习deeplearning第...
2017-12-27 10:20:20 3981 1
原创 Andrew Ng's deeplearning Course4Week4 Special applications(特殊应用:人脸识别及神经风格转换)
一、人脸识别与验证1.什么是人脸识别人脸验证就是输入一个图片和姓名/ID,然后去数据库找这人的图像与当前图像进行匹配看看是不是同一个人。而人脸识别是有一个K个人图像的数据库,而输入仅仅只有一个图像,你就得去数据库中找哪个人最接近输入的这个图像,识别出来(或者没有这个人)。2.one-shot学习(一次学习)因为人脸识别只能通过一个样本来学习,因此我们需要解决的就
2017-12-24 19:03:05 637
原创 Andrew Ng's deeplearning Course4Week3 Object detection(目标检测)
一、目标定位与特征点检测1.目标定位由上图可知,之前我们学习的是图片分类的问题,而图片分类的定位问题就是建立在图片分类的基础上的,而目标的检测又是在图片分类定位问题的基础上实现的。目标的定位的输入就是图片,经过一系列CONV,pool池化后最后输出一个形似如下的softmax,包含有4个值,包括目标的中心坐标(bx,by),目标的边界大小bh,bw。该如何定义输出变量y呢?y0也就是Pc的值为0~...
2017-12-22 23:04:14 684 2
原创 Andrew Ng's deeplearning Course4Week2 Deep convolutional models(深度卷积网络:实例探究)
一、经典网络1.LeNet-5LeNet-5的结构为conv->pool->conv->pool->fc->fc->output。在LeCun写这篇论文的时候,这里的激活函数采用的是sigmoid和tanh,不过现在也可以使用ReLU。还有一个优点是参数相对来说不多。2.Alex-net AlexNet的结构为conv->pool->conv->pool->conv
2017-12-20 13:44:44 1229
原创 Andrew Ng's deeplearning Course4Week1 Convolutional Neural Networks(卷积神经网络)
一、计算机视觉深度学习帮助计算机视觉很好的发展,如无人驾驶车识别路上的行人和车辆,人脸识别,艺术风格迁移。如上图所示,深度学习在大图像上有一个问题,那就是维度。之前64*64*3的维度才12288,但是如果是1000*1000像素的大图片,那么维度就是3million,假设第一层有1000个隐藏单元,那么就是3billion。输入维度太大,在参数如此大量的情况下,难以获取足
2017-12-03 21:27:26 1005
原创 Andrew Ng's deeplearning Course3Week2 ML Strategy2(结构化机器学习)
一、误差分析1.执行误差分析如何执行误差分析呢?我们可以将dev和test集里的错误标记进行人工整理,画张表,最后统计出各个错误的原因所占的比例,这花不了太长时间,但对改善效果可能会有很大帮助,毕竟去改善占比61%的错误总比花大量时间去解决占比8%的错误要来得高效。2.清除标记错误的例子有些例子并不是分类分错了,而只是因为某种原因把标记标错了,我们要根据这类错误所占的百
2017-11-30 22:36:28 530
原创 Andrew Ng's deeplearning Course3Week1 ML Strategy(结构化机器学习)
一、机器学习的策略什么是机器学习策略,机器学习的策略就是一些分析机器学习问题的方法。当你的模型精准度达到90%时,还不够好,你想让它更好,你可以选择收集更多的数据,尝试更大或更小的网络,尝试dropout,尝试调整各种参数,你的选择太多了,但你并不知道调整过后效果怎么样,可能花费几个月时间但是效果并没长进,有什么应对办法嘛,那就是正交化。正交化,对于那些知道正交化的人来说,他们
2017-11-30 13:50:51 364
原创 Andrew Ng's deeplearning Course2Week3 Hyperparameter tuning, Batch Normalization and Frameworks
一、超参数调试1.超参数的选择次序超参数的重要程度:1.α 2.β、hidden units、mini-batch size 3.layers、learning rate decay 4.β1、β2、ε(通常设为0.9,0.999,10^-8)2.超参数的选取(随机取值,精确搜索)假设我们的超参数1为学习率α,超参数2为ε,明显α的重要程度要大于ε,如果像上图左边的
2017-11-29 20:31:19 766
原创 Andrew Ng's deeplearning Course2Week2 Optimization algorithms(优化算法)
优化算法能帮助我们快速训练模型一、mini-batch梯度下降法1.batch vs mini-batch向量化能让你相对快速的处理m个样本,但是当m比较大时,例如5000000,速度可能就会比较慢了。因此,我们将m个样本切分成一块一块的,这就是mini-batch,而原先不切分的形式就是batch。X{t},Y{t}:我们用X{t}和Y{t}分别表示X和Y的第t块样本集。2.
2017-11-28 22:31:59 388
原创 Andrew Ng's deeplearning Course2Week1 Practical aspects of Deep Learning(深层学习的实用层面)
1 深度学习的实用层面1.1 基础1.1.1 深度学习应用简述正如上图所说:深度学习的应用是一个高度迭代的过程,对于隐藏层的数量,隐藏单元数,学习率,激活函数这些该怎么选,我们其实心里并没有数,我们只有在一次次的选择和迭代过程中才能不断找到更好的,因此深度学习是一个高度迭代的过程。1.1.2 训练/开发/测试集的选择高质量的训练数据集、验证集和测试集可以有效的提高循环的
2017-11-12 15:30:12 422 2
原创 Andrew Ng's deeplearning Course1Week4 Deep neural network(深层神经网络)
4 深层神经网络4.1 深层神经网络概述正如上图中所示,logisitic regression是一个浅层的模型,当隐藏层的数量足够多的时候,我们就说这是一个深层的神经网络。4.2 深层神经网络中的前向传播和前面的浅层神经网络一样,每一层计算z[L] = W[L] * a[L-1] + b[L], a[L] = g[L](z[L]),最终得到y帽。将其向量化后就
2017-11-11 11:00:46 501 1
原创 Andrew Ng's deeplearning Course1Week3 Shallow neural networks(浅层神经网络)
1.1 What is a neural network?最上面的是logistic回归的模型,把许多这种模型叠加起来就得到了一个neural network,就如同上图中的下半部分。第一层是一个logistic回归,第二层也是一个logistic回归。在上图的neural network模型中,第0层x1,x2,x3为输入层,中间的为隐藏层,最后的为输出层。我们把它叫作2
2017-11-10 20:07:34 351
原创 Andrew Ng's deeplearning Course1Week2 Programming Questions(编程题)
Logistic Regression with a Neural Network mindsetBuild the general architecture of a learning algorithm, including:Initializing parametersCalculating the cost function and its gradientUsin
2017-10-21 10:33:28 1015
原创 Andrew Ng's deeplearning Course1Week2 Neural Networks Basics(神经网络基础)
2.1 二分2.1.1 举一个识别猫的例子输入一个图片,判别有猫或无猫,这就是一个简单的二分分类。为了将图片转换成一个特征向量,大家都知道图片由红绿蓝三个像素矩阵组成,假设这个矩阵是64*64的,我们将之重构(Python里面是用reshape这个方法),将三个矩阵合并为一个nx(nx即维度,nx=64*64*3)行1列的矩阵。(x,y)表示一个单独的样本,假设有m个训练集,那m个训练样本就是{(...
2017-10-19 22:08:55 815
原创 Andrew Ng's deeplearning Course1Week1 Nerual Networks and Deep Learning(神经网络和深度学习)
Introduction to deeplearning1.深度学习介绍提到深度学习就不得不说到神经网络。那什么是神经网络呢?神经网络指一种有效的模拟大脑的学习算法。例1:单神经网络。根据房的大小来预测房价就是一个单神经网络,根据大小得出房价,中间的小圆圈就是单神经(single neuron),实现了一个ReLU函数功能。ReLU即rectified linear unit,即修正线性单元。(这...
2017-10-12 12:27:07 500
原创 B1021. 个位数统计 (15')
给定一个k位整数N = dk-1*10^k-1 + ... + d1*10^1 + d0 (00),请编写程序统计每种不同的个位数字出现的次数。例如:给定N = 100311,则有2个0,3个1,和1个3。输入格式:每个输入包含1个测试用例,即一个不超过1000位的正整数N。输出格式:对N中每一种不同的个位数字,以D:M的格式在一行中输出该位数字D及
2017-05-17 17:48:24 223
原创 B1020. 月饼 (25’)
月饼是中国人在中秋佳节时吃的一种传统食品,不同地区有许多不同风味的月饼。现给定所有种类月饼的库存量、总售价、以及市场的最大需求量,请你计算可以获得的最大收益是多少。注意:销售时允许取出一部分库存。样例给出的情形是这样的:假如我们有3种月饼,其库存量分别为18、15、10万吨,总售价分别为75、72、45亿元。如果市场的最大需求量只有20万吨,那么我们最大收益策略应该是卖出全部15万吨第
2017-05-17 17:08:18 263
原创 B1019. 数字黑洞 (20')
给定任一个各位数字不完全相同的4位正整数,如果我们先把4个数字按非递增排序,再按非递减排序,然后用第1个数字减第2个数字,将得到一个新的数字。一直重复这样做,我们很快会停在有“数字黑洞”之称的6174,这个神奇的数字也叫Kaprekar常数。例如,我们从6767开始,将得到7766 - 6677 = 10899810 - 0189 = 96219621 - 1269
2017-05-17 16:33:43 210
原创 B1018. 锤子剪刀布 (20')
大家应该都会玩“锤子剪刀布”的游戏:两人同时给出手势,胜负规则如图所示:现给出两人的交锋记录,请统计双方的胜、平、负次数,并且给出双方分别出什么手势的胜算最大。输入格式:输入第1行给出正整数N(输出格式:输出第1、2行分别给出甲、乙的胜、平、负次数,数字间以1个空格分隔。第3行给出两个字母,分别代表甲、乙获胜次数最多的手势,中间有1个空格
2017-05-17 16:04:41 385
原创 B1017. A除以B (20')
本题要求计算A/B,其中A是不超过1000位的正整数,B是1位正整数。你需要输出商数Q和余数R,使得A = B * Q + R成立。输入格式:输入在1行中依次给出A和B,中间以1空格分隔。输出格式:在1行中依次输出Q和R,中间以1空格分隔。输入样例:123456789050987654321 7输出样例:17636684150
2017-05-15 17:20:21 310 2
原创 B1016. 部分A+B (15')
正整数A的“DA(为1位整数)部分”定义为由A中所有DA组成的新整数PA。例如:给定A = 3862767,DA = 6,则A的“6部分”PA是66,因为A中有2个6。现给定A、DA、B、DB,请编写程序计算PA + PB。输入格式:输入在一行中依次给出A、DA、B、DB,中间以空格分隔,其中0 输出格式:在一行中输出PA + PB的值。
2017-05-15 17:17:36 226
原创 B1015. 德才论 (25')
宋代史学家司马光在《资治通鉴》中有一段著名的“德才论”:“是故才德全尽谓之圣人,才德兼亡谓之愚人,德胜才谓之君子,才胜德谓之小人。凡取人之术,苟不得圣人,君子而与之,与其得小人,不若得愚人。”现给出一批考生的德才分数,请根据司马光的理论给出录取排名。输入格式:输入第1行给出3个正整数,分别为:N(=60),为录取最低分数线,即德分和才分均不低于L的考生才有资格被
2017-05-15 15:31:33 403
原创 B1014. 福尔摩斯的约会 (20')
大侦探福尔摩斯接到一张奇怪的字条:“我们约会吧! 3485djDkxh4hhGE 2984akDfkkkkggEdsb s&hgsfdk d&Hyscvnm”。大侦探很快就明白了,字条上奇怪的乱码实际上就是约会的时间“星期四 14:04”,因为前面两字符串中第1对相同的大写英文字母(大小写有区分)是第4个字母'D',代表星期四;第2对相同的字符是'E',那是第5个英文字母,代表一天里
2017-05-04 17:38:22 620
原创 B1013. 数素数 (20')
令Pi表示第i个素数。现任给两个正整数M 输入格式:输入在一行中给出M和N,其间以空格分隔。输出格式:输出从PM到PN的所有素数,每10个数字占1行,其间以空格分隔,但行末不得有多余空格。输入样例:5 27输出样例:11 13 17 19 23 29 31 37 41 4347 53 59 61 67 71 73 79 8
2017-05-04 15:30:28 607
原创 B1012. 数字分类 (20')
给定一系列正整数,请按要求对数字进行分类,并输出以下5个数字:A1 = 能被5整除的数字中所有偶数的和;A2 = 将被5除后余1的数字按给出顺序进行交错求和,即计算n1-n2+n3-n4...;A3 = 被5除后余2的数字的个数;A4 = 被5除后余3的数字的平均数,精确到小数点后1位;A5 = 被5除后余4的数字中最大数字。输入格式:每个输入包含1个测
2017-04-30 15:58:49 246
原创 B1011. A+B和C (15')
给定区间[-2^31, 2^31]内的3个整数A、B和C,请判断A+B是否大于C。输入格式:输入第1行给出正整数T(输出格式:对每组测试用例,在一行中输出“Case #X: true”如果A+B>C,否则输出“Case #X: false”,其中X是测试用例的编号(从1开始)。输入样例:41 2 32 3 42147483647 0 2147
2017-04-29 11:28:37 197
原创 B1010. 一元多项式求导 (25')
设计函数求一元多项式的导数。(注:xn(n为整数)的一阶导数为n*xn-1。)输入格式:以指数递降方式输入多项式非零项系数和指数(绝对值均为不超过1000的整数)。数字间以空格分隔。输出格式:以与输入相同的格式输出导数多项式非零项的系数和指数。数字间以空格分隔,但结尾不能有多余空格。注意“零多项式”的指数和系数都是0,但是表示为“0 0”。输入样例:3 4
2017-04-28 16:59:59 271
原创 B1009. 说反话 (20')
给定一句英语,要求你编写程序,将句中所有单词的顺序颠倒输出。输入格式:测试输入包含一个测试用例,在一行内给出总长度不超过80的字符串。字符串由若干单词和若干空格组成,其中单词是由英文字母(大小写有区分)组成的字符串,单词之间用1个空格分开,输入保证句子末尾没有多余的空格。输出格式:每个测试用例的输出占一行,输出倒序后的句子。输入样例:Hello World
2017-04-28 16:25:30 242
原创 B1008. 数组元素循环右移问题 (20')
一个数组A中存有N(N>0)个整数,在不允许使用另外数组的前提下,将每个整数循环向右移M(M>=0)个位置,即将A中的数据由(A0 A1……AN-1)变换为(AN-M …… AN-1 A0 A1……AN-M-1)(最后M个数循环移至最前面的M个位置)。如果需要考虑程序移动数据的次数尽量少,要如何设计移动的方法?输入格式:每个输入包含一个测试用例,第1行输入N ( 1=0);第2行输入N
2017-04-28 14:31:39 298
原创 B1007. 素数对猜想 (20')
让我们定义 dn 为:dn = pn+1 - pn,其中 pi 是第i个素数。显然有 d1=1 且对于n>1有 dn 是偶数。“素数对猜想”认为“存在无穷多对相邻且差为2的素数”。现给定任意正整数N (输入格式:每个测试输入包含1个测试用例,给出正整数N。输出格式:每个测试用例的输出占一行,不超过N的满足猜想的素数对的个数。输入样例:20输出
2017-04-28 14:11:32 237
原创 B1006. 换个格式输出整数 (15')
让我们用字母B来表示“百”、字母S表示“十”,用“12...n”来表示个位数字n(输入格式:每个测试输入包含1个测试用例,给出正整数n(输出格式:每个测试用例的输出占一行,用规定的格式输出n。输入样例1:234输出样例1:BBSSS1234输入样例2:23输出样例2:SS123解题思路:很直观,将得到的
2017-04-20 23:38:08 241
原创 B1005. 继续(3n+1)猜想 (25')
卡拉兹(Callatz)猜想已经在1001中给出了描述。在这个题目里,情况稍微有些复杂。当我们验证卡拉兹猜想的时候,为了避免重复计算,可以记录下递推过程中遇到的每一个数。例如对n=3进行验证的时候,我们需要计算3、5、8、4、2、1,则当我们对n=5、8、4、2进行验证的时候,就可以直接判定卡拉兹猜想的真伪,而不需要重复计算,因为这4个数已经在验证3的时候遇到过了,我们称5、8、4、2
2017-04-20 19:38:29 436
原创 B1004. 成绩排名(20')
读入n名学生的姓名、学号、成绩,分别输出成绩最高和成绩最低学生的姓名和学号。输入格式:每个测试输入包含1个测试用例,格式为第1行:正整数n第2行:第1个学生的姓名 学号 成绩第3行:第2个学生的姓名 学号 成绩... ... ...第n+1行:第n个学生的姓名 学号 成绩其中姓名和学号均为不超过10个字符的字符串,成绩为0到100之间的一个整数,这里保证在一组测
2017-04-04 21:28:23 1098
原创 B1003. 我要通过!(20')
“答案正确”是自动判题系统给出的最令人欢喜的回复。本题属于PAT的“答案正确”大派送 —— 只要读入的字符串满足下列条件,系统就输出“答案正确”,否则输出“答案错误”。得到“答案正确”的条件是:1. 字符串中必须仅有P, A, T这三种字符,不可以包含其它字符;2. 任意形如 xPATx 的字符串都可以获得“答案正确”,其中 x 或者是空字符串,或者是仅由字母 A 组成
2017-04-03 18:28:32 307
原创 B1002. 写出这个数 (20')
读入一个自然数n,计算其各位数字之和,用汉语拼音写出和的每一位数字。输入格式:每个测试输入包含1个测试用例,即给出自然数n的值。这里保证n小于10100。输出格式:在一行内输出n的各位数字之和的每一位,拼音数字间有1 空格,但一行中最后一个拼音数字后没有空格。输入样例:1234567890987654321123456789输出样例:
2017-03-31 22:32:26 353
原创 B1001. 害死人不偿命的(3n+1)猜想(15')
卡拉兹(Callatz)猜想:对任何一个自然数n,如果它是偶数,那么把它砍掉一半;如果它是奇数,那么把(3n+1)砍掉一半。这样一直反复砍下去,最后一定在某一步得到n=1。卡拉兹在1950年的世界数学家大会上公布了这个猜想,传说当时耶鲁大学师生齐动员,拼命想证明这个貌似很傻很天真的命题,结果闹得学生们无心学业,一心只证(3n+1),以至于有人说这是一个阴谋,卡拉兹是在蓄意延缓美国数学界
2017-03-31 22:20:30 442
原创 Git常用命令
Git的常用命令初始化和建立项目init & clonegit init初始化git clone 地址clone项目add & commitgit add (file)git add *.cgit add .添加file添加扩展名为c的所有文件添加
2017-03-29 18:08:31 218
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人