自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(44)
  • 资源 (1)
  • 收藏
  • 关注

原创 2021-05-11

今天突然想来写几个字。距离去年的今年的明天大概还有一个晚上,我觉得自己有一些长进,也有了不少懈怠。长进就是我现在基本言出必行说到做到,尽我所能在对身边的人好,尽我所能的在与朋友相处,甚至我与舍友的关系也有了突飞猛进的提高。我这才发现原来对别人好是一件很幸福的事情,自己也真的会因为帮到了别人而快乐。这一年来也真的很快乐,交到了最最好的一群姐妹(?),每天都有人可以聊天,可以分享快乐的事情。然而可能是由于原本出国的计划搁浅了,我的意志力与专注力似乎有了质的下降(也可能是因为一月份开始延续了三个月的失恋)。

2021-05-11 16:38:55 136

原创 学着使用HFO

环境是配完了,但是也不一定会用hhh我摸索了一阵,记录一下。首先运行一个demo,关于两个player之间传球的.sh文件:./example/passing_agents.sh记得要在HFO主目录下运行哦,这个意思就是运行HFO/example/ 目录下的passing_agents.sh文件,你去目录下看看还真有!打开看看,就很简单的几行代码。运行结果就是两个小人一直在传球。然后我注意到example目录下还有很多.sh文件,这些都是可以运行的,内容就是他文件名标注的。比如说我又运行了一个d

2021-01-02 09:52:06 568 2

原创 吴恩达深度学习笔记——第一二课

做图像识别的时候,大多使用CNN来解决:在用python构建神经网络的时候,输入设置为一个nx * m的矩阵,其中nx是每一个样本的长度(64643),m是所有样本的总数m个。这样设置的时候便于神经网络的构建。Loss Function:关于激活函数sigmoid 和 softmax两者用于分类时,都可以将分类器输出的原始值转化为概率sigmoid 适合于各种情况的概率不需要相加为1的时候,即,两种或以上情况是可能同时存在的。而softmax的输出值相加为1,适合于只能有一种结果,不能有两种或以

2020-08-14 23:02:01 237 1

原创 2020-08-14

今天得到一个噩耗,小贝贝没了。中午听到的消息,到现在晚上七点还是不愿意相信它就这么没了。总觉得它还在我身边。上次和它一起玩还跟它商量,我说如果你也有好多条命,就像电影里拍的那样,就请你下一辈子一定做我的狗。不知道它能不能听懂,也不知道能不能成真,我是真的希望以后我有机会养狗了之后它还能在我身边。世界上最好的小贝贝。...

2020-08-14 19:16:52 134

原创 现代谱估计结课作业

(1)重点知识点梳理第一章(复习内容):信号功率谱密度的计算(包括确定信号、随机信号)DTFT(逆DTFT)功率谱密度的性质(非负性、奇偶性)经过系统H(z)后功率谱的变化谱估计问题的定义,方法(非参数法和参数法)--------- 总结:第一章是对于之前课程(信号与系统、数字信号处理、高级数字信号处理、随机信号分析)的总结与复习,并且提出了本门课程要解决的问题,是对于前置课程的补充以及扩展。从十分熟悉的信号功率谱计算开始,顺带复习了DTFT方法、功率谱的性质和信号经过系统后功率谱的变化,最

2020-08-11 20:04:52 1792 3

原创 ISSUE_1_people‘s ability to think for themselves

As people rely more and more on technology to solve problems, the ability if human to think for themselves will surely deteriorate.It is true that technology nowadays has developed to such an extent that people are saved from doing those plodding work. Ho

2020-08-11 20:04:28 176

原创 安装HFO(Half Field Offense)环境

老师让复现论文算法,需要用到HFO环境(Half Field Offense),我找了很久的教程,发现除了原作者在github上readme和其中比较详细的manul手册,竟然没有一篇完整的博客是写怎么安装这个的!相关的只有Robocup 2d完整版的环境。那没办法了,就照着手册来吧……首先要知道,这个环境必须要在Ubuntu系统下安装!!!(我还纳闷怎么没有win的说明……丢人)然后就花了一天时间安装了Ubuntu系统,其中过程也十分曲折,参看这篇博客安装Ubuntu系统踩过的坑。正式开始!我们

2020-08-11 20:03:43 1045 2

原创 安装Ubuntu系统

我真的,安装这东西花了一晚上一中午,吃午饭也没吃好,好在过程还算顺利,在下面记录一下这个过程。

2020-08-11 20:03:35 197 1

原创 linear algebra ----- (AB)T = BTAT 证明

Given an m×nm\times nm×n-matrix AAA and an n×pn\times pn×p-matrix BBB. Prove that (AB)T=BTAT(AB)^T = B^TA^T(AB)T=BTAT.Here is my attempt:Write the matrices AAA and BBB as A=[aij]A = [a_{ij}]A=[aij​] and B=[bij]B = [b_{ij}]B=[bij​], meaning that their (i,

2020-08-11 11:06:09 3971

原创 Argument 总结句

The author’s recommendation heavily relies on the assumption that …Based on such an assumption, the author therefore … However, this assumption is potentially problematic because …If this is the case, the author’s assumption will not hold and this recomm

2020-07-20 10:53:15 112

原创 ARGUMENT_domestic or imported cheese

The author of this passage comes to the conclusion that his stores should discontinue stocking any imported cheeses and focus instead on domestic cheeses in order to make profits. In surpporting his claim, the author points out the preference for domestic

2020-07-09 22:35:17 135

原创 water sports

The author of the argument recommended the city government to invest more money to install riverside recreational facilities, pointing out that this major operation would appeal considerable citizens to use these facilities and thus reach higher satisfacti

2020-07-04 17:17:04 145

原创 Restrictions on community exterior appearance(revise)

The letter written by the committee of homeowners claims that once they adopt the restrictions on the exterior appearance of Deerhaven, the property values in Deerhaven would increase as happened in Brookville. In supporting his claim, the author uses as p

2020-07-02 22:46:24 110

原创 Restrictions on landscope

While it may be true that restrictions on the landscaping and house painting can lead the property values in Deerhaven Acres to go up, the author’s arugument is filled with holes and obvious flaws, which dose not make a convincing case to persuade all the

2020-06-28 20:47:12 207

原创 Palean Woven Baskets

For a long time, it has been war ranging on in the land of Asgard. The young Thor stands up with his best mates to fight the evil Locky—his younger brother. After a while his mother died of I don’t know what but she died anyway. And his father was frozen

2020-06-26 21:15:02 186

原创 十分危险的修改profile文件以及恢复方法

昨天为了配置anaconda的环境变量而修改了profile文件,结果因为这里的文件写、删除的方式我太陌生了,就出现了问题,本来在后面加一行export xxxxxx 就可以,结果由于我的不当操作,出现了很多奇怪的行……网上搜索的解决办法大多是让我在终端输入指令,然后恢复ls等终端操作。但是这样治根不知本啊,今天我登陆的时候出现错误消息告诉我检测到profile文件有几行不能识别,请尽快解决。我当时真的好害怕T_T然后人工过滤了一些指令的解决办法之后,找到了怎么修改profile的方法!使用管理员

2020-05-22 08:52:52 3397 2

原创 Ubuntu系统下conda安装Pytorch(CPU)

历经千辛万苦,我,cll,终于在ubuntu上用anaconda安装上了pytorch!太感人了。记录一下吧!首先,我的电脑因为没有N卡(买电脑的时候也不知道要用到n卡)所以就用CPU版的了,去官网找好指令之后(这里我是conda install pytorch torchvision cpuonly -c pytorch),我先试了一下,果然很慢啊,以我的经验肯定下不下来的。所以我选择用镜像源。一般我都用清华的镜像源,找到了这篇教程,非常详细具体!安装pytorch重点:这篇文章介绍了想要用镜像源

2020-05-21 21:52:40 662

原创 阅读文献——各种 gradient descent 方法

文献链接:An overview of gradient descent optimization algorithms我一直对于 gradient descent 的机制没有搞透,就很好奇这梯度到底怎么搞的。(我觉得关键是因为我高数学的太水,学梯度的时候没有用非数学的想法去理解它)先又重复一遍老内容:Batch Gradient Descent也就是最朴素的GD,就真的很朴素:θ = θ −η∇θJ(θ)\theta~=~\theta~-\eta\nabla_{\t

2020-05-19 10:25:47 201

转载 tensorflow使用(二)—— tf.argmax, tf.equal, tf.cast,tf.truncated_normal

tf.argmax()函数tf.argmax可以认为就是np.argmax。tensorflow使用numpy实现的这个API。  简单的说,tf.argmax就是返回最大的那个数值所在的下标。tf.argmax(array,axis)当axis=1时返回每列最大值的下标,当axis=0时返回每行最大值的下班。tf.equal()函数tf.equal(A,B)是对比这两个矩阵或者向量的相等的元素,如果是相等的那就返回True,反正返回False,返回的值的矩阵维度和A是一样的A = .

2020-05-16 22:27:31 164

原创 第一次比较顺利地阅读英文文献(课堂记录)——关于gradient descent 的介绍

这次的阅读比较顺利,不知道是因为原文因为是课堂记录所以比较简单还是在下的水平确实提高了。总之开心!原文链接:这是一篇stanford的计算机视觉课程课程记录,我一看教授是李飞飞,果然是斯坦福啊,我也想去斯坦福。一些学术名词当然了,英文文献最大的障碍就是一些专有名词的理解,下面我列一下:convex function 凸函数,就是初中还是高中学的那个。(其实看形状更像是凹的……注意一下嗯)convex set 就是凸数集,就是说,在之中的任意两个数连接起来的线段,线段上的点都包含在这个集合中。也

2020-05-16 10:55:31 307

原创 DRL(八)—— Monte Carlo Tree Search (MCTS)

一个比较有意思的在离散情况下的 planning 方式。之所以叫做tree search,我觉得就是因为这种方法就是像树杈一样从根部到树叶不断地搜索。就像下图这样:要注意的是:每个节点的含义,并不是每个state,而是采取某个特定的action后到达的state,这个state可以是不同的。比如说,从s1s_1s1​开始,我们如果执行action a1 = 0a_1~=~0a1​ = 0,如图所示就会到达左边的s2s_2s2​,只要执行action a1&n

2020-05-14 22:50:39 291

原创 DRL(七)—— Cross Entropy Method

这一讲是关于 model based 的情况的。首先熟悉几个概念吧。open-loop & close-loop**close-loop: ** 智能体在与环境交流的时候,每观察到一个observation(也就是每一个state)都会进行一次动作的选取。**open-loop: ** 智能体在和环境交流的时候,观察到一个observation(st),会选择一连串的动作[a1, a2, ... ..., aT][a_1,~a_2,~...~...,~

2020-05-14 16:47:16 415 2

原创 一点感悟

人们都说初心不改,初心不变,我之前一直觉得这句话酸酸的,现在倒是明白一些了。初心指的不只是梦想吧,还有心态,最初的心态。就像我现在一样,感觉怎么样都难以找回当年的心了。努力而卑微,说是谦卑似乎更合适。无限想回去看看以前的自己。先从不紧张做起吧,嗯。还没到无力回天的情况吧。现在唯一感激自己的是,在面临更大的挑战之前就发现了这个致命的问题,我不敢想像如果是之后冒出这个问题我该怎么办,我是否能够安全的挺过去。感觉是曾经一点一点丢掉了,现在就由我自己一点一点地找回来吧。趁着自己才是二十岁。这才是年轻真好的

2020-05-12 17:09:08 97

原创 DRL(六)——高级策略梯度

这一讲主要在讲policy gradient,注意,教授经常提到的horizon,就是11−γ1\over1-\gamma1−γ1​ , 就是∑tγt  (t starts from 0)\sum_t\gamma^t~~(t~starts~from~0)∑t​γt  (t starts from 0),这个求和的结果是11−γ1\over1-\gamma1−γ1​ 。(我还不是很明白这个是在干嘛……).

2020-05-11 21:04:57 175

原创 一点心情

最近有些“反刍”,我假装没看到。不断告诉自己不要再刷手机了,可是老是控制不住自己……害。玩也不是不能玩,但是刷手机真是一种消极的娱乐方式吧。突然想起前几天李学姐说的“没有什么未来是值得自己去牺牲现在的”,我不禁在想如果有人在我大二的时候告诉我这句话就好了hhh,我会少了多少痛苦呀。现在在家咸鱼,心情逐渐平缓,想想之前的自己不禁觉得有些荒唐好笑,一手好牌虽然不算打得稀烂也确实没有得到应该有的结果。又想起于老师的签名,“A man with love is a man can be trusted”,一直以

2020-05-11 11:23:53 116

原创 DRL(五)——DDPG

在我的笔记DRL(四)——value function中,大部分讲了Q Learning的算法、存在的问题和解决的措施。这一个笔记的内容是紧接上一篇的。为什么要提出DDPG呢?因为不管是DQN也好,DDQN也好,都是离散动作的,就是说,action是有限的。然而很多时候action都是连续的,这时候就需要新的方法了。在连续动作空间中怎样选择最优action呢?我们知道,在离散动作的Q Le...

2020-05-07 21:56:46 335

原创 DRL(四)——Value Function

感觉这一讲的内容大多都在复习之前我在RL里学过的内容,而且我发现,相比于David Silver 的强化学习内容,这个伯克利的DRL课程顺序刚好相反。RL是由表格型开始,讲了V(s) 和 Q(s, a),之后再讲的Function approximator,而DRL是先Policy Gradient 然后才提到Q Function。虽然内容都差不多,但是我还没明白不同的顺序是否侧重点不同,而两...

2020-05-06 22:45:43 904

原创 第四次作业——好像很容易的FIR滤波器

前奏一波为什么说好像很容易呢?因为这个题是L老师出的 因为这个题很多前面复杂的步骤都已经给出了,比如滤波器的系数,本来是要用MATLAB生成的,但是因为是集成电路的竞赛,所以应该不涉及MATLAB的运用,所以直接给了,这就减少了很多工作量(尤其是考虑到本人是MATLAB渣渣,真的一点都不喜欢这个软件(因为当年dsp恶心到了?))然后,这个题就只剩下了设计一个滤波器。而设计一个FIR滤波器,就比...

2020-05-05 22:41:41 515

原创 pytorch的一些基础基础基基础

numpy一些numpy的基础知识,我只整理了些看到用到的。np.hstack()import numpy as npa = [[1,2,3], [4,5,6], [7,8,9]]print(a)b = np.hstack(a)print(b)结果:[[1, 2, 3], [4, 5, 6], [7, 8, 9]][1 2 3 4 5 6 7 8 9]...

2020-05-02 22:43:14 193

原创 DRL(三)——Policy Gradient

这个策略梯度相关的知识我在 David Silver 的强化学习课程里学习过了已经,再看一遍这个伯克利的,好像还挺重要,marshal学长说的。推导过程这个过程也大致看过首先是使用了一个log函数的性质,见上图,然后就可以转化的简单一点然后就可以进行下面这样然后,如果跟maximum likelihood 相比较,就会发现这个策略梯度的变化的值,相比起来每一项都多乘了获得的rewa...

2020-04-22 21:10:55 168

原创 第三次作业——十分困难的SPI传输

题目听肥子说这题是去年他舍友出的,比老师出的还难,果然……刚开始看还没觉得怎么样,做了一会觉得不行了,做不下去了:(看题光题干就这么长,大佬,果然是大佬。分析假装写个分析吧,其实还没明白呢...

2020-04-21 23:01:20 198

原创 DRL(二)—— RL简介

RL StructureRL中基本包括三个部分,如下图:Model-Based RL在model-based RL里,绿格子里是预判下一个状态St+1。橙色格子依然是产生样本,绿色格子是利用这些样本去产生一个fφ,利用这个函数,可以预测下一个状态。用样本使这个函数越来越拟合。这样可以得到一个确定的policy,a deterministic policy,在确定的环境中可以工作的较好,...

2020-04-20 13:55:05 1890

原创 第二次集电课笔记

状态机的写法状态机是用来控制整个运行组件,用来“喊节拍”,告诉什么时候做什么事情。cnt可以看作是状态机,flag也可以看成是状态机。状态机可以不只有一个。写法:写成两部分,一部分是时序逻辑D触发器,另一部分是组合逻辑。如下图:D触发器①的输入是n_state,也就是 next state 的意思,输出是c_state,也就是current state的意思。组合逻辑部分②的作用就...

2020-04-18 23:47:23 146

原创 DRL(一)——Supervised Learning and Imitation

写在前面今天开始学习DRL了,其实RL还没完全看完……大概总结一下感觉这节课讲的内容是比较初级的一些方法,从标题就看得出来,Supervised Learning,和 Imitation。教授先是讲了imitation,就是通过人类的training,建立data,然后智能体用这个data来模仿。这样当然有很多问题,比如training中的情况可能不会包含所有的情况,总是会有新的情况出现;...

2020-04-16 22:46:30 187

原创 RL(七)——Policy Gradient Methods

Policy-based Reinforcement Learning在之前的学习中,我们都是从 value function 里直接得到policy,比如说 e-greedy policy。接下来,我们就要将 policy 参数化,parametrise the policy.依然是model-free使用这种 policy-based RL,相比之前的基于价值函数的方法,好处就是不需...

2020-04-15 13:52:33 172

原创 学习的一点心得?

好的,又是一样的夜晚,我对着电脑,右半脑其实还有点疼,越来越不知所措,不会的东西太多,自己学习很慢,似乎怎么都不会有会的那一天。本来想找学姐问问这DRL该怎么学从哪开始,然后她说……是这样的……然后还说了一些“鼓励”我的话,其实hh老师是太聪明了,所以以为所有人都像他一样聪明,而我们的作用就是告诉他,他错了。这也是我一直以来觉得的,怎么说,每次感觉这周做的东西还可以,然后给老师看,然后,...

2020-04-14 21:31:01 94

原创 第二次作业——UART

UART通用异步收发传输器(Universal Asynchronous Receiver/Transmitter,通常称作UART) 是一种串行异步收发协议,应用十分广泛。UART工作原理是将数据的二进制位一位一位的进行传输。在UART通讯协议中信号线上的状态位高电平代表’1’低电平代表’0’。当然两个设备使用UART串口通讯时,必须先约定好传输速率和一些数据位。...

2020-04-13 21:47:50 555

原创 第一次集电课笔记

关于描述电路我们要写的就只有1和2部分,而1部分是组合逻辑,描述1对于D触发器:下面就是一个异步D触发器。always @ (posedge clk or negedge res_n) if(~rst_n) Q <= 0; else Q <= D;注意当rst_n信号生效时,作用是给Q清零或者置位,所以给Q的值必须是常数。改成同步:把敏感信号中的rst_n删...

2020-04-11 20:49:40 119

原创 Tensorflow使用(一)—— Session,placeholder,以及新旧版本的配置

关于Tensorflow说实话这到底是个啥我还没明白(明白了再删这句话)。也并不准备了解的多么详细,还是老办法,只看看用过的用到的,其他那些慢慢来,又不是准备考试,也没必要一口吃成大胖子。不废话了。一些用过的函数,必须先定义变量,并且必须进行 initialize变量,通过下面给出的方法(直接run(initializer) 或者 定义init函数之后run(init))tf.assi...

2020-04-11 12:16:15 1283

原创 第一次作业——生成crc校验码

关于crc校验码的原理,就不详细的说了,感觉心里明白就可,比赛前再看看。求法大概这样:给定一个生成多项式g(x)=xn1+xn2+… …+1,这里最高幂次假设是m。假设g(x) = x4 + x3 + 1,则对应代码为G = 11001。要发送的信息为A假设A = 1011001,接着将A左移m位(即在A右侧添m个零)得到B然后用B模二除G,所得的余数就是校验字段crc校验码。模2...

2020-04-09 22:40:44 2087 3

Webster.zip

可以放在欧陆词典,就可以识别成词库了。准备gre的朋友可能会用得上,因为有时候可能访问韦氏词典的官方网站会非常慢或者打不开。

2020-08-13

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除