自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 阿里暑期实习算法岗笔试题(java)2020.04.29场

T1题目描述有n中不同口味的水果,第i种水果的数量为a[i],现在需要把水果分给m个人。分给每个人水果的数量必须是相等的,并且每个人只能选择一种水果。也就是说,可以把一种水果分给多个人,但是一个人的水果不能有多种。每个人最多能分到几个水果?输入描述输入第一行有一个整数T,代表接下来有T组测试数据。接下来T组,每组第一行有两个整数n,m,第二行有n个整数a[i],表示第i种水果的个数...

2020-04-30 22:15:00 1062 2

原创 美团点评实习生算法岗笔试题 (java) 2020.04.23场

T1 幸运星题目描述在观星的时候,一种常用的方式是划出类似于正方形的区域内,确定其中所有星星的坐标。现在我们在星空(一个无限大的二维平面)上简历坐标系。由于星星很小,我们忽略它的面积,认为每一个星星是一个点,且所有星星的坐标都是整数。幸运星的定义是这一颗星星在这个平面内,正上,正下,正左,正右都有其他的星星(不一定相邻)。现在,我们已经将这个正方形的取余取出,并且将她们所在的坐标给你。...

2020-04-30 02:26:10 1719 2

原创 腾讯暑期实习算法岗笔试题(java) 2020.04.26场

腾讯2020暑期实习在线笔试 4.26场T1T2T3T4功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能,丰富你的文章UML 图表FLowchart流程图导出与导入导出导入C代码题解在这...

2020-04-28 19:55:26 543

转载 python函数参数前面单星号(*)和双星号(**)的区别

https://www.cnblogs.com/arkenstone/p/5695161.html(转一下,下次能找到)

2019-08-14 20:38:41 138

转载 可迭代对象 详解

转发:https://www.cnblogs.com/new-rain/p/9991932.html(记录一下网址,下次就找得到了)

2019-08-14 14:25:53 118

翻译 第二章 多臂老虎机(二)

最佳初始值有偏(bias):定义:依赖于初始值的方法称为对初始值有偏。断言:样本平均方法遍历完所以动作之后,有偏会消失;常数步长因子方法不会。证明:∵N(A)=1⇒Q(A)=Q(A)+1N(a)(R−Q(A))=R\because N(A)=1 \Rightarrow Q(A)=Q(A)+\frac{1}{N(a)}(R-Q(A))=R∵N(A)=1⇒Q(A)=Q(A)+N(a)1​(R...

2019-07-22 22:59:18 409

翻译 第二章 多臂老虎机(一)

第二章 多臂老虎机两种反馈:纯估计性反馈(purely evaluative feedback)和纯指示性反馈(purely instructive feedback)纯估计性反馈:估计某个动作好坏的程度,而不是该动作是否最好或者最坏。依赖于实际采取的动作。纯指示性反馈:指示正确的动作,与实际采取的动作无关。这种反馈是监督学习的基础。本章学习目标:研究这两种反馈的区别与联系。2.1 ...

2019-07-21 22:43:12 896

翻译 第一章 强化学习简介

第一章 介绍强化学习的基本思想:从与环境的互动中学习1.1 强化学习强化学习的重要特征:➀、反复试验(trial-and-error search)➁、推迟奖励(delayed reward)➀、已知状态StS_{t}St​,需要做一个动作AtA_{t}At​,得到一个奖励信号RtR_{t}Rt​以及接下来的状态St+1S_{t+1}St+1​。  目标是:通过调整AtA_{t}At​...

2019-07-09 23:11:58 593

翻译 记号

≐\doteq≐        根据定义等于≈\approx≈        约等于∝\propto∝        正比于PrX=xPr{X=x}PrX=x    随机变量XXX取值xxx的概率X∼pX\sim pX∼p      随机变量XXX服从于概率分布p(x)≐Pr{X=x}p(x)\doteq Pr\{X=x\}p(x)≐Pr{X=x}E[x]\mathbb{E}[x]E[x...

2019-07-05 23:14:28 172

翻译 目录

目录1 简介1.1 强化学习1.2 实例1.3 强化学习的元素 (Elements of RL)1.4 限制和范围 (Limitations and Scope)1.5 扩展实例: Tic-Tac-Toe(三连棋游戏)      两人轮流在印有九格方盘上划“+”或“O”字, 谁先把三个同一记号排成横线、直线、斜线, 即是胜者...

2019-07-04 23:42:16 310 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除