自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

小小何先生的学习之旅

一切有为法,如梦幻泡影,如露亦如电,应作如是观。

原创 给予粉丝的重磅好消息

原因 由于很多人来问我相关的技术问题,我也不能一一解答,所以成立个技术交流群,很多东西小编知道的给别人说完了,知道的人就多了,大家一起互帮互助,共同进步,小编也省事了。 解决办法 我们可以扫描下面这个二维码加群,如果失效了,可以添加小编微信,备注:技术交流。小编就会拉你进群啦。要是没有备注的...

2019-11-30 22:10:46 356 1

原创 【LeetCode】557. 反转字符串中的单词 III

题目描述   给定一个字符串,你需要反转字符串中每个单词的字符顺序,同时仍保留空格和单词的初始顺序。   示例 1: 输入: "Let's take LeetCode contest" 输出: "s'teL ekat edoCteeL tsetno...

2020-06-04 20:50:17 10 0

转载 C++ string类相关函数

1、简介   string 类是 STL 中 basic_string 模板实例化得到的模板类。其定义如下: typedef basic_string <char> string;   basic_string 此处可以不必深究。   string 类的成员函数有很多,同一个名字的函...

2020-06-04 16:47:42 9 0

原创 【LeetCode】70. 爬楼梯 C++(执行时间和内存消耗均击败100%用户)

题目解析   假设你正在爬楼梯。需要 n 阶你才能到达楼顶。   每次你可以爬 1 或 2 个台阶。你有多少种不同的方法可以爬到楼顶呢?   注意:给定 n 是一个正整数。 示例 1: 输入: 2 输出: 2 解释: 有两种方法可以爬到楼顶。 1. 1 阶 + 1 阶 2. 2 阶 示例 2...

2020-06-04 10:02:07 14 0

原创 【LeetCode】498. 对角线遍历

题目描述   给定一个含有 M x N 个元素的矩阵(M 行,N 列),请以对角线遍历的顺序返回这个矩阵中的所有元素,对角线遍历如下图所示。 示例: 输入: [ [ 1, 2, 3 ], [ 4, 5, 6 ], [ 7, 8, 9 ] ] 输出: [1,2,4,7,5,3,6,8,9...

2020-06-03 20:23:21 19 0

原创 【LeetCode】48. 旋转图像 (执行时间和内存消耗均击败100%用户)

题目描述 给定一个 n × n 的二维矩阵表示一个图像。 将图像顺时针旋转 90 度。 说明: 你必须在原地旋转图像,这意味着你需要直接修改输入的二维矩阵。请不要使用另一个矩阵来旋转图像。 示例 1: 给定 matrix = [ [1,2,3], [4,5,6], [7,8,9] ]...

2020-06-03 09:50:05 38 0

原创 【LeetCode】56. 合并区间

题目概述   给出一个区间的集合,请合并所有重叠的区间。 示例 1: 输入: [[1,3],[2,6],[8,10],[15,18]] 输出: [[1,6],[8,10],[15,18]] 解释: 区间 [1,3] 和 [2,6] 重叠, 将它们合并为 [1,6]. 示例 2: 输入: [[1,...

2020-06-01 19:56:48 29 0

原创 【LeetCode】674. 最长连续递增序列

题目描述   给定一个未经排序的整数数组,找到最长且连续的的递增序列。 示例 1: 输入: [1,3,5,4,7] 输出: 3 解释: 最长连续递增序列是 [1,3,5], 长度为3。 尽管 [1,3,5,7] 也是升序的子序列, 但它不是连续的,因为5和7在原数组里被4隔开。 示例 2: 输入...

2020-05-31 11:54:58 27 0

原创 【LeetCode】面试题53 - II. 0~n-1中缺失的数字

文章目录题目描述初步解题思路Python实现进阶解题思路Python实现C++实现 题目描述   一个长度为n-1的递增排序数组中的所有数字都是唯一的,并且每个数字都在范围0~n-1之内。在范围0~n-1内的n个数字中有且只有一个数字不在该数组中,请找出这个数字。 示例 1: 输入: [0,1,3...

2020-05-30 13:38:14 78 0

原创 【浙江大学PAT真题练习乙级】1009 说反话 (20分)真题解析

文章目录题目描述思路解析C++实现Python实现 题目描述   给定一句英语,要求你编写程序,将句中所有单词的顺序颠倒输出。 输入格式:   测试输入包含一个测试用例,在一行内给出总长度不超过 80 的字符串。字符串由若干单词和若干空格组成,其中单词是由英文字母(大小写有区分)组成的字符串,单词...

2020-05-29 18:51:23 38 0

原创 【浙江大学PAT真题练习乙级】1008 数组元素循环右移问题 (20分)真题解析

文章目录题目描述思路解析C++实现Python实现 题目描述   一个数组AAA中存有NNN(>0)个整数,在不允许使用另外数组的前提下,将每个整数循环向右移M(≥0)M( \geq 0)M(≥0)个位置,即将AAA中的数据由(A0A1,⋯ ,AN−1A_{0}A_{1},\cdots,A_...

2020-05-29 13:26:48 16 0

原创 【浙江大学PAT真题练习乙级】1007 素数对猜想 (20分) 真题解析

文章目录题目描述思路解析C++实现Python实现 题目描述   让我们定义dnd_{n}dn​为dn=pn+1−pnd_{n}=p_{n+1}-p_{n}dn​=pn+1​−pn​,其中pip_{i}pi​是第iii个素数。显然有d1=1d_{1}=1d1​=1,且对于n>1n>1n...

2020-05-28 11:22:10 92 0

原创 【浙江大学PAT真题练习乙级】1006 换个格式输出整数 (15分) 真题解析

文章目录题目描述思路解析C++实现Python实现 题目描述   让我们用字母 B 来表示“百”、字母 S 表示“十”,用 12...n来表示不为零的个位数字 n(<10)(<10)(<10),换个格式来输出任一个不超过 3 位的正整数。例如 234 应该被输出为 BBSSS12...

2020-05-27 15:25:59 57 0

原创 【浙江大学PAT真题练习乙级】1005 继续(3n+1)猜想 (25分) 真题解析

题目描述   卡拉兹(Callatz)猜想已经在1001中给出了描述。在这个题目里,情况稍微有些复杂。   当我们验证卡拉兹猜想的时候,为了避免重复计算,可以记录下递推过程中遇到的每一个数。例如对 n=3 进行验证的时候,我们需要计算 3、5、8、4、2、1,则当我们对 n=5、8、4、2 进行验...

2020-05-27 09:36:02 114 0

原创 【浙江大学PAT真题练习乙级】1004 成绩排名 (20分) 真题解析

题目描述   读入 n(>0)名学生的姓名、学号、成绩,分别输出成绩最高和成绩最低学生的姓名和学号。 输入格式:   每个测试输入包含 1 个测试用例,格式为   第 1 行:正整数 n   第 2 行:第 1 个学生的姓名 学号 成绩   第 3 行:第 2 个学生的姓名 学号 成绩   ...

2020-05-26 11:18:29 127 0

原创 【浙江大学PAT真题练习乙级】1003 我要通过!(20分) 真题解析

文章目录题目描述思路解析C++实现Python实现 题目描述 “答案正确”是自动判题系统给出的最令人欢喜的回复。本题属于 PAT 的“答案正确”大派送 – 只要读入的字符串满足下列条件,系统就输出“答案正确”,否则输出“答案错误”。 得到“答案正确”的条件是: 字符串中必须仅有 P、 A、 T这...

2020-05-25 08:04:31 118 0

原创 机器学习系列之【结构化学习】

文章目录Unified FrameworkStatistics求解Proof of Termination参考   机器学习中大部分问题考虑的输入都是一个向量,输出是另外一个向量。而现实生活中的问题往往比这复杂地多,输出可能是一个sequence,list,tree或者bounding box。如...

2020-05-24 18:49:09 380 0

原创 【浙江大学PAT真题练习乙级】1002 写出这个数(20分) 真题解析

文章目录题目描述思路解析C++实现Python实现 题目描述 读入一个正整数 n,计算其各位数字之和,用汉语拼音写出和的每一位数字。 输入格式: 每个测试输入包含 1 个测试用例,即给出自然数 n 的值。这里保证 n 小于 10​10010​^{100}10​100​​ 。 输出格式: 在一行内输...

2020-05-24 18:48:40 35 0

原创 【浙江大学PAT真题练习乙级】1001 害死人不偿命的(3n+1)猜想(15分)真题解析

题目描述 卡拉兹(Callatz)猜想: 对任何一个正整数 n,如果它是偶数,那么把它砍掉一半;如果它是奇数,那么把 (3n+1) 砍掉一半。这样一直反复砍下去,最后一定在某一步得到 n=1。卡拉兹在 1950 年的世界数学家大会上公布了这个猜想,传说当时耶鲁大学师生齐动员,拼命想证明这个貌似很傻...

2020-05-24 18:48:18 128 0

原创 求通俗解释下bandit老虎机是个什么东西?
原力计划

  在说bandit之前先考虑一个实际问题:假设你来到一个新的城市,你刚开始选择去哪吃饭可能随机选一选,你大概会知道哪些店比较符合你的口味。当你有了一些基本的判断之后,你是会选择吃原来觉得好吃的店呢?还是探索你从来都没有去过的店呢?从来都没有去过的店你可能会觉得更好吃,也有可能不会。人的选择一般都...

2020-05-23 17:39:32 297 0

原创 LQR、Stochastic Bandits、Bayesian Bandits、Contextual Bandits与基于模型的强化学习浅析
原力计划

  很多做基于模型的强化学习算法的学者(MBRL)都知道其与最优控制有千丝万缕的关系。那是什么关系呢?   在强化学习算法中所谓的model-based指的是控制对象(强化学习中称之为环境environment)的状态转移xt+1=f(xt,ut)x_{t+1}=f(x_{t},u_{t})xt+...

2020-05-22 00:34:32 173 0

原创 线搜索中有最速下降法、牛顿法、拟牛顿法、共轭梯度法汇总
原力计划

  最速下降法利用目标函数一阶梯度进行下降求解,易产生锯齿现象,在快接近最小值时收敛速度慢。Newton法利用了二阶梯度,收敛速度快,但是目标函数的Hesse矩阵不一定正定。于是出现了修正的Newton法,主要是对不同情况进行了分情况讨论。Newton法的优缺点都很突出。优点:高收敛速度(二阶收敛...

2020-05-18 18:25:46 294 0

翻译 多臂老虎机导论(二)Stochastic Bandits

  问题描述如下:   算法的目标是最大化累计奖励,基于三个假设: 奖励的设定遵循bandit feedback。也就是说算法只能观测到所选择动作的奖励。 对于每个动作aaa,都有一个奖励分布Da\mathcal{D}_{a}Da​与之对应,每次这个动作aaa被选中,反馈的奖励将会从这个分布中...

2020-05-18 14:12:30 97 0

翻译 多臂老虎机导论(一)引言
原力计划

  本系列主要是上述这本Introduction to Multi-Armed Bandits的读书笔记。   多臂老虎机是一个简单但非常强大的算法框架,主要是在一段时间内不确定情况下做出决策。主要描述的是,一个算法有K个可能的动作可供选择,也就是臂,还有T轮。在每一轮中,算法选择一个臂,并为这个...

2020-05-18 14:12:18 105 0

原创 如何通俗易懂地理解基于模型的强化学习?
原力计划

  Model Free Reinforcement Learning(MFRL)算法:MFRL中无须知道Transition或者Reward Models。解决这类问题的方法大体上有三种: Value-Based Method (Q-Learning)。 Policy-Based Method...

2020-05-18 10:59:05 85 0

翻译 基于深度学习的人类语言处理(三)语音转换

文章目录引言算法 引言   语音转换Voice Conversion (VC),是希望转换音色,在神经网络中描述就是输入一段声音讯号,输出一段声音讯号,但是音色已经发生了改变(内容一样)。 Samples for “Unsupervised Singing Voice Conversion” ...

2020-05-18 00:28:52 174 0

翻译 基于深度学习的人类语言处理(二)语音辨识

  在语音辨识中输入是语音信号,输出是对应的文字。语音表示为一个序列向量(长度为T\text{T}T,维度为 d\text{d}d)。输出的Text一般表示为一个Token序列,长度为N\text{N}N,V\text{V}V个不同的token所构成,通常 T>N\text{T} > ...

2020-05-18 00:28:41 174 0

翻译 基于深度学习的人类语言处理(一)引言

  本文主要是对李宏毅教授的《Deep Learning for Human Language Processing (2020,Spring)》这门课程笔记。 所有课程资料可以在以下链接中找到:http://speech.ee.ntu.edu.tw/~tlkagk/courses_DLHLP2...

2020-05-18 00:28:27 45 0

原创 机器学习系列之【支持向量机】
原力计划

  支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的 ,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够 推广应用到函数拟合等其他机器学习问题中。   1963年,Vapnik在解决模式识别问题时提出了支持向量方法,这种...

2020-05-13 16:47:18 386 0

原创 Animal-AI 2.0.0发布了!快来测试你的智能体吧。

  游戏环境经常被用来评估智能体的“能力”。一般都是给定状态转移概率,以一个分布或者在当前状态采取某个动作以固定的概率转移到下一个状态,以及奖励函数也是确定的。那真实的世界真的是这样的吗?当然不是,真实的世界要比这复杂地多,就连动物都能学地比这更好。   难道就因为Alphago打败了李世石,我们...

2020-05-05 20:12:58 114 0

原创 人工智能的下个十年在推理?
原力计划

  描述性统计和推论性统计那个更有说服力?   清华大学计算机系唐杰教授最近有做一个主题报告《人工智能下一个十年》,先阐述了最近快速发展的算法,并思考人工智能的未来到底是什么?相信做AI的都会思考这样一个问题,这东西究竟靠谱吗?唐杰教授对未来的期望主要是说认知图谱: 认知图谱   对于解决复杂的逻...

2020-04-24 13:38:43 63 0

转载 typedef struct LNode *list和struct LNode有什么区别?

  typedef struct LNode *list表示定义了一个别名list,list代表 struct LNode *类型的别名,它是一个指针类型。list a,就代表定义了一个struct LNode *类型的变量a。   而struct LNode代表一个结构体类型。struct LN...

2020-04-22 00:35:55 164 0

原创 【5分钟Paper】Fast强化学习和Slow强化学习

文章目录所解决的问题背景所采用的方法?取得的效果?所出版信息?作者信息? 论文标题:Fast Reinforcement Learning Via Slow Reinforcement Learning 所解决的问题   让RL学地更快一点。 背景   动物可以很快学习一些事情,而强化学习需...

2020-04-20 17:22:13 54 0

原创 谷歌大脑阿尔伯塔联合发表:离线强化学习的优化视角【附代码】
原力计划

文章目录所解决的问题背景所采用的方法?Ensemble-DQNRandom Ensemble Mixture (REM)取得的效果?所出版信息?作者信息?参考资料 论文题目:An Optimistic Perspective on Offline Reinforcement Learning ...

2020-04-20 09:11:31 109 1

原创 【RL-GAN-Net】强化学习控制GAN网络,用于实时点云形状的补全。
原力计划

文章目录所解决的问题背景所采用的方法?取得的效果?所出版信息?作者信息?参考资料 论文题目:RL-GAN-Net: A Reinforcement Learning Agent Controlled GAN Network for Real-Time Point Cloud Shape Comp...

2020-04-18 18:33:09 134 0

原创 强化学习中价值迭代和策略迭代各有什么优缺点?

策略迭代   策略迭代法(Policy Iteration method)是动态规划中求最优策略的基本方法之一。它借助于动态规划基本方程,交替使用“求值计算”和“策略改进”两个步骤,求出逐次改进的、最终达到或收敛于最优策略的策略序列。   我们发现如果想知道最优的策略,就需要能够准确估计值函数。然...

2020-04-18 12:01:42 125 0

原创 【ICLR2020】看未知观测:一种简单的蒙特卡洛并行化方法
原力计划

文章目录所解决的问题背景MCTS经典的MCTS并行方法所采用的方法?取得的效果?所出版信息?作者信息?参考资料 论文题目:Watch The Unobserved:A Simple Approach To Parallelizing Monte Carlo Tree Search 所解决的问...

2020-04-18 00:15:16 78 0

原创 【NIPS 2017】基于深度强化学习的想象力增强智能体
原力计划

论文题目:Imagination-Augmented Agents for Deep Reinforcement Learning 所解决的问题? 背景 所采用的方法? 取得的效果? 所出版信息?作者信息?

2020-04-15 17:06:41 36 0

翻译 马尔可夫随机场数学原理理解

  马尔科夫随机场(Markov Random Fields,MRF)是无向概率图模型。那什么是马尔可夫随机场呢?它又能解决什么问题呢?   比如一个图像去噪问题:   马尔可夫随机场中的每一个节点代表一个像素点,这是图结构的建模过程。节点之间由边连接,也即是像素点之间由边相连。在这里也可以看出...

2020-04-14 19:20:26 89 0

原创 伯克利,斯坦福,宾大联合发表:从观察和交互中学习预测模型

论文题目:Learning Predictive Models From Observation and Interaction 所解决的问题? 作者在这里所关心的是,智能体采样很难采样到那些表现性能比较好的样本,就是说有些状态动作对根本就采不到,因为很难去学习这么好的策略,但是人类可以很轻松...

2020-04-14 19:19:42 62 0

提示
确定要删除当前文章?
取消 删除