自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(38)
  • 收藏
  • 关注

原创 2021暑假杂谈

唔,一晃一个暑假都快过了,前两天参加了阿里的笔试,提前ak了,下午和hr聊了一聊,实习生如果能在大厂转正的话,确实挺香的(hr:你们上完学再来不也是拿这么多嘛,逃)字节跳动的后端也投了一份,实话实说,acm对找工作确实很有用,目前还没有决定去哪里。这两天一直没有睡着(毕竟是最近一个最重要的决定),虽然真的很想出去看看,但是国内外这情况感觉美国真的去不了了,英国or新加坡or香港or…的研究生回国再找工作感觉认可度也不高(而且托福之前考的不高,呜呜呜)我是一个有些选择困难症的人,然而选择又要受局势的制约

2021-09-02 19:30:35 214 2

原创 2021夏令营半程体验

等了一晚上ECNU数据学院终于出了,拿到了学硕的优营。和BUAA的夏令营比起来,还是感觉BUAA的整体氛围更严谨啊,从入营到选拔到公示透明度都更高一点,不愧是计算机专业争三的学校啊(逃)NJUcs真的好遗憾啊,本来想着过了笔试线下机试肯定没问题,结果笔试没过orz。如果预推免没机会的话,彻底与南京大学彻底无缘了嘤嘤嘤。这两天就躺着休息了,弱校CSer想找个学上真的不容易。...

2021-07-15 19:05:00 267

原创 可能是大三的最后一次杂谈

刚刚写完了一次大实验的报告,感觉一下子轻松了一些。猛然想起离停课也只有两周了,这学期一直在忙于卷各种实验报告,和想象中的大三下完全不一样啊。上周把计网和操作系统看了一遍,之前看的线代和概统貌似又忘了(逃昨天把几所学校的报名表交了,希望这学期绩点别掉了,然后不管怎样能有两个入营吧。...

2021-06-12 19:48:58 145

原创 最近的一些感悟

时间真是过的快啊,一下子就到期中了。上次考完CSP整个人迷迷糊糊的,几个月没做题有点生疏(分数涨了排名降了是什么感受233) 推荐信打算找lpf签字,听了他的指点确实要改一下。有的时候停下来想一想,或许人生本就是选择大于努力的,在这个关头,把精力放在夏令营上,确实是目前我最稳妥,也是风险最小的一个选择了。不知道明年这个时候会是怎样,也不知道前路究竟是平坦还是坎坷呢?感悟完要去背微机原理了(逃...

2021-04-19 21:06:03 149

原创 大创笔记(二)

首先按照https://blog.csdn.net/qq_44655971/article/details/108255794?spm=1001.2014.3001.5501跑通把轨迹数据和folium_code.py放在D盘然后直接运行MyServlet.java,会弹出来一个交互界面输入id和k,点击提交需要等一会,会弹出不用颜色显示的轨迹目前存在的问题:1、是直接用Kafka模拟生产者和消费者暴力计算的,并且只取了前1000条,运行时间很长2、每条轨迹的点数过多,有的有1000个点,

2021-02-26 12:00:35 344

原创 大创笔记(一)

首先安装tomcat,把环境变量配置好安装完成好运行bin\startup.bat在浏览器中输入localhost:8080后出现说明安装成功如果不成功,可能是8080端口被占用,参考https://blog.csdn.net/qq_37489565/article/details/85196403将模板代码导入,如果jakarta飘红参考把test.py放在D盘,运行MyServlet.java会弹出一个网页点击yue后弹出如果点yue之后弹不出图片,可能是没有把matplotli

2021-02-24 19:19:43 373

原创 CCF201803-4 棋局评估

上一次写博客已经不知道是什么时候了过完年就一直在家里睡,除了花了点时间和舍友搞了搞大创(舍友TQL),也没干啥正经事回想这一学期,虽然有过焦虑与不安,但总算是度过来了,蓝桥杯让竞赛加分有了保底,也考了个不高不低的托福成绩(ps:阅读与口语一个分是什么感受) 如果明年的大政策不变的话,应该是不出去了写简历的时候才觉得自己项目与科研经历那里好空啊,下学期打算多加点内容到大创里,可能要再联系个老师搞点科研之类的(不然科研经历真的要零了233)上午做了可能是3个月来的第一道题,看到数据范围就想到是搜索,CS

2021-02-23 18:03:13 126

原创 2020总结

又到了一年的最后一天了,虽然复习很紧张但也想留下些东西。2020真的是Trouble Year啊,从年初的疫情肆虐,到保研政策的大改。有段时间自己也一直很焦虑,不知道该干些什么。托福、蓝桥、CSP、建模,这学期一直在忙,却忙的迷迷糊糊的。在这个过程中也更加体会到,所有的一切都必须依托于一个既定的平台。没有金子能永远发光,我们所获得的很大程度上依赖机遇、环境这些东西。而优秀的品质、内心的强大,以及面对变化时平静的心境,才能使我们每次沉沦时度过难关。2020年,要向过去说再见了,不知道明年这个时候,我又

2020-12-31 19:40:50 152

原创 第21次CCF计算机软件能力认证B题题解

晚上游戏打到一半舍友说分数出来了,和预想的差不多C和D题对着数据范围骗了一点分。。。B题确实比之前几次都难啊,没接触过确实很难想出来。排序之后,对于每一个可能的答案,维护当前阈值下正确的个数即可。具体可以看代码#include<iostream>#include<cstring>#include<string>#include<algorithm>#include<cstdio>using namespace std;int

2020-12-13 20:34:19 687 1

原创 第十一届蓝桥杯国赛总结

唔,这三周真的是忙啊,本来以为大三课少会稍微空一点的。编译原理没有一次是两个下午就能写完的,人工智能上课讲讲基本概念,作业直接关系抽取。期中也复习的匆匆忙忙的,每天挤出时间来学习托福和刷题。已经忘了上次睡的一个完整的午觉是什么时候了。昨天的国赛状态是真的不好,一直卡在第四题,奇奇偶偶的分了半天才理清楚,导致最后的几道大题随便写了一点骗了点分。。。本来以为题目难度是递增的,结果第五题反而简单。考完真的以为只有优胜奖了,没想到晚上结果出来居然还有三等奖。。。看来蓝桥杯是真的水结束总算事情少了一样,

2020-11-15 21:29:22 960

原创 Neural machine translation by joinly learning to align and translate

基本的encoder–decoder对长句子的翻译很困难。本文提出不再把源句子encode成一个固定长度的向量,而是encode成a sequence of vectors,decode的时候选择这些向量的子集。任何长度的句子翻译都有提升,尤其是长句子。...

2020-10-13 22:25:08 134

原创 一些开学后的感悟

唔,不知不觉开学已经三周了,感觉比想象的大三还要忙碌啊。第一周跟着两个神仙队友搞了三天建模比赛,选了相对难的B题,不知道能不能有一个比较好的结果 。最后一天在文成楼集体熬夜,第一次体会到了什么叫坐在那里就能睡着。最后能把结果跑出来还是很安慰的(一些选B的队做到一半就跑路了)其实对上学期做出的退acm的决定还是有点放不下,一段时间不AC总感觉少了点什么,希望今年留下来的能更上一层楼。然后就是抽空练习口语和听力,报了一次11月底的托福。挺大的一个变化是不管每天多忙都会坚持每天1h的锻炼,引体向上也慢慢从

2020-09-23 22:36:10 180

原创 周记八

这两天用kafka模拟了实时数据,并进行了相似度的计算。轨迹数据集用的是https://blog.csdn.net/u011511601/article/details/81535600里面的2.T-Drive Taxi Trajectories首先运行ZOOKEEPER和kafka安装教程参考https://blog.csdn.net/lh756437907/article/details/99622979然后运行Prod.java,输入要查询的轨迹id1再运行Consu.java,输入k,代

2020-08-27 11:24:02 206

原创 周记七

这周还是和上周一样,早上7点出门,晚上6点才到家吃晚饭,口语比原来顺多了,希望明天的模考能有点进步。。。这周我继续看了上周的论文,TRAJECTORY SIMILARITY SEARCH和TRAJECTORY SIMILARITY JOIN部分实在有点难懂。。。就把下面的EXPERIMENTS部分仔细看了看。首先是下载了不同的大数据集通过随机相似度查询的方式来比较他们所需的时间(threshold越大,所需时间一般也越多)Scalability:增加轨迹数据的规模,时间增加了多少Scale-up:

2020-08-23 17:21:03 148

原创 周记六

唔,这周真的是忙啊,每天6小时的英语课上到头昏这周本来想在上周已学Folium的基础上看看还有没有能深入的地方,但看了很多博客觉得还是上次的那个运用不同颜色将轨迹显示最贴近我们的项目于是就仔细地把一篇《DITA: Distributed In-Memory Trajectory Analytics》读了一遍,希望通过总结能获取一些思路。轨迹的数量超出了the storage and processing capabilityof a single machinein distributed env

2020-08-16 17:02:03 191

原创 利用条件随机场模型进行中文分词

https://www.cnblogs.com/liufanping/p/4899842.html

2020-08-09 18:04:51 288

原创 周记五

这周学习了python的地图可视化库Folium,成功运用不同颜色将轨迹显示出来import foliumimport ref = open("C:\\Users\\容错率\\Desktop\\轨迹数据\\release\\taxi_log_2008_by_id\\1.txt") # 返回一个文件对象 line = f.readline() # 调用文件的 readline()方法 res=[]while line: #

2020-08-09 17:50:28 237

原创 周记四

这周我先从网上下载了轨迹数据集到本地,它是来自微软T-Drive项目,包含在2008年北京一万多俩出租车一周的轨迹数据。这个数据集包含了1500万个坐标点,轨迹的总距离达到900多万公里。然后通过文件流的方式,逐行读入,根据格式将String拆分,将信息提取。再定义了Point类,方便将数据包装输出。...

2020-08-02 18:57:38 132

原创 周记三

这周参考了几篇网上的博客,用java实现了Kafka消息的读取与写入,需要分别实现生产者和消费者

2020-07-26 16:00:39 119

原创 2020百度之星初赛第一场D题Civilization

退了ACM队之后,也七七八八有一个月没有做题了吧。这个暑假真的是挺忙碌的,本来想把百度之星鸽掉的,但昨天睡醒之后有觉得应该来参加一下,不管结果怎么样。前三题应该都是签到题难度(当然如果没有打过ACM就不一定了),看到这个D我的第一反应就是暴力,但题意真的难读。。。最后是通过1次wa才最终完全理解。其实就是枚举城市的建设位置,通过dfs记录回合数。#include<iostream>#include<algorithm>#include<cstring>#incl

2020-07-20 16:15:31 341

原创 Word2Vec

https://blog.csdn.net/liuyuemaicha/article/details/52611219http://www.hankcs.com/nlp/word2vec.htmlhttps://www.cnblogs.com/pinard/p/7243513.html

2020-07-19 22:01:48 223 2

原创 周记二

这周看了一些博客,把ZOOKEEPER以及KAFKA安装完成。1.运行Zookeeper2.运行KAFKA3.创建TOPICS4. 打开一个PRODUCER5.打开一个CONSUMER可以看到,通过命令行成功将流数据传入CONSUMER下周目标:尝试编写java程序将kafka消息队列传入进行流处理。...

2020-07-19 17:17:17 149

原创 循环神经网络

RNN:理论上可以往前看(往后看)任意多个词RNN隐藏层的值sts_tst​的值不仅取决于当前的输入xtx_txt​,还取决于st−1s_{t-1}st−1​输出层是一个全连接层,隐藏层是循环层。ot=g(Vst)o_t=g(Vs_t)ot​=g(Vst​)st=f(Uxt+Wst−1)s_t=f(Ux_t+Ws_{t-1})st​=f(Uxt​+Wst−1​)循环神经网络的输出值oto_tot​,是受前面历次输入值xt,xt−1,...x_t,x_{t-1},...xt​,xt−1​,...影响

2020-07-15 21:12:24 155

原创 周记一

暑假的第一周,过的还是很忙碌的。7号看了许多博客,遇到了各种问题,最终把fink1.93下了下来,把IDEA配置好了(之前写JAVA用的Eclipse),把maven下了下来,学别人用java写了一个wordcount,在本地成功运行。把项目打jar包,上传Flink后台运行时,可以看到,项目确实是在运行。但是我在命令行中输入单词时,Stdout却并没有输出显示相应的结果,不知道是什么原因。8-10号和数学建模的队友模拟了一次比赛,码了3天Matlab还是很辛苦的。11号和高中同学出去聚了一天

2020-07-12 18:21:27 218

原创 一些最近的呓语

前几天做了一个可以说对我影响很大的一个决定:退了ACM。 其实也是思考了很久,一方面是由于疫情比赛有取消的风险,另一方面自己确实离金牌选手有很大距离。其实心里最对不起的是两个队友,算法会继续学,但是那无数个一起做题,一起苦恼,一起快乐的日子,永远也回不来了。 暑假里报了托福,接了nlp的项目,也会是一个并不空闲的暑假。或许人生本该如此,本就充满了许多变数。但2年的ACM经历,已经成为了我大学生活中不可缺少的一部分。许多事情仍历历在目,在南京离一等奖只差几十分钟罚时,在徐州满怀期待却打铁而归...

2020-07-02 07:53:08 191

原创 深度学习实践(一)

模模糊糊的选课终于结束了,猛然发现每周多了一天假期哇(不是)一直在担心的军事理论也应该能重修了,如果疫情一直没有缓解的话,大方向应该是保研没错了(但真心想考一次托福,也想出去看看呢)眼看快期末了,把上一周的深度学习入门的东西又看了看。第一次写了一个辨别猫脸的神经网络,读取文件的部分完全参考了别人的,学习参数的部分则是自己写的# -*- coding: utf-8 -*-"""Created on Thu May 28 14:51:31 2020@author: 容错率"""import

2020-05-28 22:06:07 1512

原创 一个简易的计算器

前两天终于把大创申报表肝完了,大改了一次,小改了无数次。从ppt的修改到视频的录制,只有真正当过负责人才知道其中的艰辛吧。然而课内作业落了不少,只能靠周末疯狂补哩。这次的JAVA实验是一个基于GUI的简单计算器。忙活了一个下午从对GUI一无所知到七七八八能写出来了。import java.awt.Container;import java.awt.Font;import java.awt.GridLayout;import java.awt.Panel;import java.awt.eve

2020-05-21 16:13:34 262

原创 胡浩基人工神经网络(一)

时隔4个月重回101,这两天把神经网络又往下看了一点,不得不说自己数学基础太差了啊,好多证明看了两遍还不会(不是)期中成绩也七七八八出来了,编译原理有点出乎意料的低一些知识点整理一个最简单的神经网络模型:yk=φ(wkTx+b)y_k=\varphi(w^T_kx+b)yk​=φ(wkT​x+b)感知器算法及其具体步骤感知器算法收敛定理证明在测试样本线性可分的前提下,这个算法可以在有限次数内结束(一些放缩的技巧)多层神经网络的一些分析定理:三层神经网络可以模拟所有决策面梯度下降算法求局部极

2020-05-12 16:14:04 1640

原创 机器学习大作业1

晚上不想看编译原理了,就把吴恩达老师第一次的大作业看了一下。我是用Matlab写的(和C++比真的简单多了)。还挺成功的,一次暴力一次梯度下降算出来的几乎相等这个是for for暴力跑出来的代码太丑就不放了这是用梯度下降跑出来的,刚开始学习率太大调了一会下面是自己写的代码% % data = load('ex1data1.txt'); % read comma separated...

2020-05-04 22:35:27 4826

原创 CF1348E(dp)

每种果子可以有两种颜色,同一个篮子只能放同一种颜色或同一棵树上的果子,问最多能放满多少个篮子可以通过安排,使每个树最多贡献一个不同颜色的篮子dp[i][j]代表前i棵树,剩余j个红果子的最多篮子数#include<stdio.h>#include<iostream>#include<cstdlib>#include<cmath>#inc...

2020-05-03 15:59:54 216

原创 CSGO(2018多校,状压dp)

看完题,第一个反应是k<=5,这个肯定要利用。然后求曼哈顿距离的最大,就要把绝对值拆成+ -的形式这样状态就可以表示了,每个副武器属性的+一定对应主武器的-,所以可以先把每个状态主武器的最大值求出来,然后用副武器去匹配#include<iostream>#include<cstring> #include<algorithm>#define l...

2020-05-01 20:27:28 363

原创 机器学习第三课

Classification:不能用线性回归Logistic Regression:0≤hθ(x)≤1{\leq}h_{\theta}(x){\leq}1≤hθ​(x)≤1(a classification algortihm)hθ(x)=g(θTx)h_{\theta}(x)=g({\theta}^Tx)hθ​(x)=g(θTx)g(z)=11+e−z\frac{1}{1+e^{-z}}...

2020-04-30 20:45:46 165

原创 Rikka with Nash Equilibrium(2018杭电多校)

题意很简单,问有多少个nm的矩阵,元素是1~nm的排列,且只有一个元素比它所在行与列的所有元素都大。很容易发现,由于是一个排列,那个满足条件的元素肯定是n*m,通过比划可以发现应从大到小把元素塞入矩阵,新塞入的元素的行或列至少有一个比它大的元素,于是就想到了用动态规划来转移。#include<iostream>#include<cstring>#include&lt...

2020-04-29 16:08:46 161

原创 机器学习第二课

梯度下降算法:Repeat{θj=θj−α∂∂θjJ(θ0,θ1...θn)\theta_j=\theta_j-\alpha\frac{\partial}{\partial\theta_j}J(\theta_0,\theta_1...\theta_n)θj​=θj​−α∂θj​∂​J(θ0​,θ1​...θn​)}simultaneously update for every j=0,1…...

2020-04-29 11:00:59 168

原创 机器学习的第一课

期中考完又是一个新的开始,这学期除了ACM还想花一些时间在其他方面,本来想做一些nlp的项目的,但看了一点发现根本看不下去,好多需要有机器学习的基础。再加上我想往AI方向读研。所以到B站上找了吴恩达老师的公开课,打算每周花上几个小时自学,顺便补补数理基础。说来也惭愧,线代概统已经不记得多少了,AI又是对数学要求如此高的学科(看西瓜书就明白了),所以也算是提前补一些知识(能学会多少就不好说了)...

2020-04-28 16:55:12 252

原创 CF1324F题解

自己入ACM的坑也有一年多了,想想自己一年前只能做到div3的D,现在已经能把F顺利做出来了。不管以后能走多远,总想留下一些东西。题意:给定n个结点一棵树,每个结点为黑色或白色,对于每个结点,找到包含它的一棵子树,使子树的白结点与黑结点个数之差最大。很容易想到O(n*n)的算法,就是以每个结点为根,从上到下dfs求每颗子树的能向下延伸的最大值,然后如果子树的最大值比0大,就将父亲的ans加上它...

2020-04-28 15:39:01 226

原创 codeforces 1295E题解

首先这题的p是一个排列,说明1~n每个整数出现且仅出现一次,并且很容易知道每个数的位置。之前做过一些线段树离散化的题目,都是离散成下标然后建树维护。首先,如果分完之后有一个集合为空,则很容易ans=min(val[1],val[n]),然后将val的前缀和建树,维护n-1个间隔对于一个数i,将sum[1]~sum[pos[i]-1]加上val[pos[i]]将sum[pos[i]]~sum[...

2020-04-02 19:16:29 169

原创 1328E - Tree Queries题解

做了这场的最后两题明显感觉比上一场的div3难啊。题意:给一棵树,每次查询包含若干个点,问是否从根存在一条路径,是每个点或在这条路径上,或离路径上的点最近距离为1。通过画图比划不难发现,一个点如果满足如上条件,则它的父亲一定在路径上,因为树结构的特殊性,如果某结点的儿子在路径中,则此节点一定也在路径中。对于同一深度的所有节点,最多只有一个结点在路径上。所以,我们先将k个结点按照深度排序,进行...

2020-03-27 21:30:05 586

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除