Mia_compiling-CSDN博客

原创 2021-05-11

今天突然想来写几个字。距离去年的今年的明天大概还有一个晚上，我觉得自己有一些长进，也有了不少懈怠。长进就是我现在基本言出必行说到做到，尽我所能在对身边的人好，尽我所能的在与朋友相处，甚至我与舍友的关系也有了突飞猛进的提高。我这才发现原来对别人好是一件很幸福的事情，自己也真的会因为帮到了别人而快乐。这一年来也真的很快乐，交到了最最好的一群姐妹（？），每天都有人可以聊天，可以分享快乐的事情。然而可能是由于原本出国的计划搁浅了，我的意志力与专注力似乎有了质的下降（也可能是因为一月份开始延续了三个月的失恋）。

2021-05-11 16:38:55 136

原创学着使用HFO

环境是配完了，但是也不一定会用hhh我摸索了一阵，记录一下。首先运行一个demo，关于两个player之间传球的.sh文件：./example/passing_agents.sh记得要在HFO主目录下运行哦，这个意思就是运行HFO/example/ 目录下的passing_agents.sh文件，你去目录下看看还真有！打开看看，就很简单的几行代码。运行结果就是两个小人一直在传球。然后我注意到example目录下还有很多.sh文件，这些都是可以运行的，内容就是他文件名标注的。比如说我又运行了一个d

2021-01-02 09:52:06 568 2

原创吴恩达深度学习笔记——第一二课

做图像识别的时候，大多使用CNN来解决：在用python构建神经网络的时候，输入设置为一个nx * m的矩阵，其中nx是每一个样本的长度（64643），m是所有样本的总数m个。这样设置的时候便于神经网络的构建。Loss Function：关于激活函数sigmoid 和 softmax两者用于分类时，都可以将分类器输出的原始值转化为概率sigmoid 适合于各种情况的概率不需要相加为1的时候，即，两种或以上情况是可能同时存在的。而softmax的输出值相加为1，适合于只能有一种结果，不能有两种或以

2020-08-14 23:02:01 237 1

原创 2020-08-14

今天得到一个噩耗，小贝贝没了。中午听到的消息，到现在晚上七点还是不愿意相信它就这么没了。总觉得它还在我身边。上次和它一起玩还跟它商量，我说如果你也有好多条命，就像电影里拍的那样，就请你下一辈子一定做我的狗。不知道它能不能听懂，也不知道能不能成真，我是真的希望以后我有机会养狗了之后它还能在我身边。世界上最好的小贝贝。...

2020-08-14 19:16:52 134

原创现代谱估计结课作业

（1）重点知识点梳理第一章（复习内容）：信号功率谱密度的计算（包括确定信号、随机信号）DTFT（逆DTFT）功率谱密度的性质（非负性、奇偶性）经过系统H(z)后功率谱的变化谱估计问题的定义，方法（非参数法和参数法）--------- 总结：第一章是对于之前课程（信号与系统、数字信号处理、高级数字信号处理、随机信号分析）的总结与复习，并且提出了本门课程要解决的问题，是对于前置课程的补充以及扩展。从十分熟悉的信号功率谱计算开始，顺带复习了DTFT方法、功率谱的性质和信号经过系统后功率谱的变化，最

2020-08-11 20:04:52 1792 3

原创 ISSUE_1_people‘s ability to think for themselves

As people rely more and more on technology to solve problems, the ability if human to think for themselves will surely deteriorate.It is true that technology nowadays has developed to such an extent that people are saved from doing those plodding work. Ho

2020-08-11 20:04:28 176

原创安装HFO（Half Field Offense）环境

老师让复现论文算法，需要用到HFO环境（Half Field Offense），我找了很久的教程，发现除了原作者在github上readme和其中比较详细的manul手册，竟然没有一篇完整的博客是写怎么安装这个的！相关的只有Robocup 2d完整版的环境。那没办法了，就照着手册来吧……首先要知道，这个环境必须要在Ubuntu系统下安装！！！（我还纳闷怎么没有win的说明……丢人）然后就花了一天时间安装了Ubuntu系统，其中过程也十分曲折，参看这篇博客安装Ubuntu系统踩过的坑。正式开始！我们

2020-08-11 20:03:43 1045 2

原创安装Ubuntu系统

我真的，安装这东西花了一晚上一中午，吃午饭也没吃好，好在过程还算顺利，在下面记录一下这个过程。

2020-08-11 20:03:35 197 1

原创 linear algebra ----- (AB)T = BTAT 证明

Given an m×nm\times nm×n-matrix AAA and an n×pn\times pn×p-matrix BBB. Prove that (AB)T=BTAT(AB)^T = B^TA^T(AB)T=BTAT.Here is my attempt:Write the matrices AAA and BBB as A=[aij]A = [a_{ij}]A=[aij] and B=[bij]B = [b_{ij}]B=[bij], meaning that their (i,

2020-08-11 11:06:09 3971

原创 Argument 总结句

The author’s recommendation heavily relies on the assumption that …Based on such an assumption, the author therefore … However, this assumption is potentially problematic because …If this is the case, the author’s assumption will not hold and this recomm

2020-07-20 10:53:15 112

原创 ARGUMENT_domestic or imported cheese

The author of this passage comes to the conclusion that his stores should discontinue stocking any imported cheeses and focus instead on domestic cheeses in order to make profits. In surpporting his claim, the author points out the preference for domestic

2020-07-09 22:35:17 135

原创 water sports

The author of the argument recommended the city government to invest more money to install riverside recreational facilities, pointing out that this major operation would appeal considerable citizens to use these facilities and thus reach higher satisfacti

2020-07-04 17:17:04 145

原创 Restrictions on community exterior appearance(revise)

The letter written by the committee of homeowners claims that once they adopt the restrictions on the exterior appearance of Deerhaven, the property values in Deerhaven would increase as happened in Brookville. In supporting his claim, the author uses as p

2020-07-02 22:46:24 110

原创 Restrictions on landscope

While it may be true that restrictions on the landscaping and house painting can lead the property values in Deerhaven Acres to go up, the author’s arugument is filled with holes and obvious flaws, which dose not make a convincing case to persuade all the

2020-06-28 20:47:12 207

原创 Palean Woven Baskets

For a long time, it has been war ranging on in the land of Asgard. The young Thor stands up with his best mates to fight the evil Locky—his younger brother. After a while his mother died of I don’t know what but she died anyway. And his father was frozen

2020-06-26 21:15:02 186

原创十分危险的修改profile文件以及恢复方法

昨天为了配置anaconda的环境变量而修改了profile文件，结果因为这里的文件写、删除的方式我太陌生了，就出现了问题，本来在后面加一行export xxxxxx 就可以，结果由于我的不当操作，出现了很多奇怪的行……网上搜索的解决办法大多是让我在终端输入指令，然后恢复ls等终端操作。但是这样治根不知本啊，今天我登陆的时候出现错误消息告诉我检测到profile文件有几行不能识别，请尽快解决。我当时真的好害怕T_T然后人工过滤了一些指令的解决办法之后，找到了怎么修改profile的方法！使用管理员

2020-05-22 08:52:52 3397 2

原创 Ubuntu系统下conda安装Pytorch（CPU）

历经千辛万苦，我，cll，终于在ubuntu上用anaconda安装上了pytorch！太感人了。记录一下吧！首先，我的电脑因为没有N卡（买电脑的时候也不知道要用到n卡）所以就用CPU版的了，去官网找好指令之后（这里我是conda install pytorch torchvision cpuonly -c pytorch），我先试了一下，果然很慢啊，以我的经验肯定下不下来的。所以我选择用镜像源。一般我都用清华的镜像源，找到了这篇教程，非常详细具体！安装pytorch重点：这篇文章介绍了想要用镜像源

2020-05-21 21:52:40 662

原创阅读文献——各种 gradient descent 方法

文献链接：An overview of gradient descent optimization algorithms我一直对于 gradient descent 的机制没有搞透，就很好奇这梯度到底怎么搞的。（我觉得关键是因为我高数学的太水，学梯度的时候没有用非数学的想法去理解它）先又重复一遍老内容：Batch Gradient Descent也就是最朴素的GD，就真的很朴素：θ = θ −η∇θJ(θ)\theta~=~\theta~-\eta\nabla_{\t

2020-05-19 10:25:47 201

转载 tensorflow使用（二）—— tf.argmax, tf.equal, tf.cast，tf.truncated_normal

tf.argmax()函数tf.argmax可以认为就是np.argmax。tensorflow使用numpy实现的这个API。　简单的说，tf.argmax就是返回最大的那个数值所在的下标。tf.argmax(array,axis)当axis=1时返回每列最大值的下标，当axis=0时返回每行最大值的下班。tf.equal()函数tf.equal(A,B)是对比这两个矩阵或者向量的相等的元素，如果是相等的那就返回True，反正返回False，返回的值的矩阵维度和A是一样的A = .

2020-05-16 22:27:31 164

原创第一次比较顺利地阅读英文文献（课堂记录）——关于gradient descent 的介绍

这次的阅读比较顺利，不知道是因为原文因为是课堂记录所以比较简单还是在下的水平确实提高了。总之开心！原文链接：这是一篇stanford的计算机视觉课程课程记录，我一看教授是李飞飞，果然是斯坦福啊，我也想去斯坦福。一些学术名词当然了，英文文献最大的障碍就是一些专有名词的理解，下面我列一下：convex function 凸函数，就是初中还是高中学的那个。（其实看形状更像是凹的……注意一下嗯）convex set 就是凸数集，就是说，在之中的任意两个数连接起来的线段，线段上的点都包含在这个集合中。也

2020-05-16 10:55:31 307

原创 DRL（八）—— Monte Carlo Tree Search (MCTS)

一个比较有意思的在离散情况下的 planning 方式。之所以叫做tree search，我觉得就是因为这种方法就是像树杈一样从根部到树叶不断地搜索。就像下图这样：要注意的是：每个节点的含义，并不是每个state，而是采取某个特定的action后到达的state，这个state可以是不同的。比如说，从s1s_1s1开始，我们如果执行action a1 = 0a_1~=~0a1 = 0，如图所示就会到达左边的s2s_2s2，只要执行action a1&n

2020-05-14 22:50:39 291

原创 DRL（七）—— Cross Entropy Method

这一讲是关于 model based 的情况的。首先熟悉几个概念吧。open-loop & close-loop**close-loop: ** 智能体在与环境交流的时候，每观察到一个observation（也就是每一个state）都会进行一次动作的选取。**open-loop: ** 智能体在和环境交流的时候，观察到一个observation（st），会选择一连串的动作[a1, a2, ... ..., aT][a_1,~a_2,~...~...,~

2020-05-14 16:47:16 415 2

原创一点感悟

人们都说初心不改，初心不变，我之前一直觉得这句话酸酸的，现在倒是明白一些了。初心指的不只是梦想吧，还有心态，最初的心态。就像我现在一样，感觉怎么样都难以找回当年的心了。努力而卑微，说是谦卑似乎更合适。无限想回去看看以前的自己。先从不紧张做起吧，嗯。还没到无力回天的情况吧。现在唯一感激自己的是，在面临更大的挑战之前就发现了这个致命的问题，我不敢想像如果是之后冒出这个问题我该怎么办，我是否能够安全的挺过去。感觉是曾经一点一点丢掉了，现在就由我自己一点一点地找回来吧。趁着自己才是二十岁。这才是年轻真好的

2020-05-12 17:09:08 97

原创 DRL（六）——高级策略梯度

这一讲主要在讲policy gradient，注意，教授经常提到的horizon，就是11−γ1\over1-\gamma1−γ1 ，就是∑tγt (t starts from 0)\sum_t\gamma^t~~(t~starts~from~0)∑tγt (t starts from 0)，这个求和的结果是11−γ1\over1-\gamma1−γ1 。（我还不是很明白这个是在干嘛……）.

2020-05-11 21:04:57 175

原创一点心情

最近有些“反刍”，我假装没看到。不断告诉自己不要再刷手机了，可是老是控制不住自己……害。玩也不是不能玩，但是刷手机真是一种消极的娱乐方式吧。突然想起前几天李学姐说的“没有什么未来是值得自己去牺牲现在的”，我不禁在想如果有人在我大二的时候告诉我这句话就好了hhh，我会少了多少痛苦呀。现在在家咸鱼，心情逐渐平缓，想想之前的自己不禁觉得有些荒唐好笑，一手好牌虽然不算打得稀烂也确实没有得到应该有的结果。又想起于老师的签名，“A man with love is a man can be trusted”，一直以

2020-05-11 11:23:53 116

Webster.zip

空空如也