- 博客(75)
- 资源 (1)
- 收藏
- 关注
原创 Neural Code Summrization: 2016-2021年 论文解读 (一)
文章目录What is code summarizationExampleOverview of neural code summarization methodSequence model (序列模型)Codenn: 第一篇使用Neural network来做code summarizationDeepcom: Structure-based 遍历的方式来展平AST(抽象语法树)插曲 what is AST---------------------------插曲结束-------------------
2021-12-10 22:13:44 1627
原创 三大统计相关系数那些事
overview相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度。如果有两个变量:X、Y,最终计算出的相关系数的含义可以有如下理解:(1)、当相关系数为0时,X和Y两变量无关系。(2)、当X的值增大(减小),Y值增大(减小),两个变量为正相关,相关系数在0.00与1.00之间。(3)、当X的值增大(减小),Y值减小(增大),两个变量为负相关,相关系数在-1.00与0.00之间。Name前提公式Pearson Correlation Coefficient正太
2021-08-13 14:23:35 398
原创 Jupyter Notebook远程登录及密码设置
安装juypter 插件conda install -c conda-forge jupyter_contrib_nbextensionsjupyter contrib nbextension install --user详细可参见link设置密码jupyter notebook --generate-config #生成Config配置文件jupyter notebook password # 生成密码Enter password:Verify password:成功操作后显示写入
2021-08-10 15:53:56 357
原创 使用Docker hub搭建并维护docker环境
使用Docker hub搭建并维护docker环境Docker hub类似于github的使用创建Dockerhub账号点击Dockerhub ,创建账号,必要时需要VPN。搭建Docker从头搭建一个Docker比较复杂,可以基于别人的docker环境来改进,以pytorch环境为例。pull 一个 docker输入关键词pytorch,点击进入找到tag,因为每个docker的image是由名字(pytorch/pytorch)和版本(tag)两部分组成。在本地运行docker pu
2021-08-03 16:46:37 1241
原创 为你写诗最后冲刺
0. 概述我们这周五的时候NLP和CV方向的model都确定跑好,和代码的事情可以周四晚上,或者周五上完课大家一起和,和完之后,我们找几个例子分析一下,拍个demo,完成这个project。1. interfaceimg2tag: input: image , output: str (for example tad = “人 树”)tag2poem: input: str o...
2019-12-23 11:41:08 180
原创 机器学习2--朴素贝叶斯
统计学基础统计于概率的基本知识统计与概率的基本知识统计与概率研究问题的区别贝叶斯分类器贝叶斯决策论MLE&MAP&贝叶斯估计朴素贝叶斯垃圾邮件分类半朴素贝叶斯贝叶斯网...
2019-11-21 18:27:15 961
原创 优化方法总结
. 优化方法研究的主要问题. 优化问题的主要思路拉格朗日乘子法,无约束的一阶必要条件,有约束的一阶必要条件 Kungdingli,. 梯度下降法的一般框架. 解决优化问题的一般框架...
2019-11-19 22:38:54 1269
原创 机器学习1 --- 决策树
1.基本思想1.1 基本思想建立分段函数进行回归和分类,自动学一个if-else-then的模型.对于来连续数据,学习机或者让模型的函数集合来自于平行于坐标轴的直线,对于离散数据,学习机就是根据离散值确定分支数。西瓜书根据西瓜的一些特征来判断西瓜的好坏,而一次我们只用一个特征,或者一看一个维度,那么根据数据集,我们可以根据一些指标使得我们可以更快更准的判断出一个西瓜是不是好瓜(做决策),这个...
2019-11-19 18:12:22 794
转载 PyCharm同目录下导入模块会报错的问题
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。 ...
2019-10-24 22:32:47 275
原创 Tiger-program1 -slp
1. 任务描述–SLP Interpreter华保健的lab1[modern complier implementation in java]总结来说就是利用前面介绍的数据结构和文法规则创建一个计算最大print参数数量的函数和一个直线型程序语言翻译器。SLP Gramar要分析的stm是2. program代码在(tiger/src/slp/)[https://github....
2019-10-14 19:36:04 207
原创 java中的super()和this
super()和this()类似,区别是,super()从子类中调用父类的构造方法,this()在同一类内调用其它方法demo‘’'java//superclasspublic class Person {Person() {System.out.println("Superclass: constrcutor without parameters ");}Person(Strin...
2019-10-14 13:42:44 137
原创 java中的多态,抽象方法和接口
1. 多态(polymorphism)1. 1方法的多态性,重载和覆写;重载(overloading):1.方法名相同 2.参数类型和个数至少一个不同 3.返回类型和修饰符可以不同覆盖(overriding):子类有一个方法,与父类某方法的名称、返回类型、参数相同,则称子类方法覆盖父类方法;注:子类方法不能缩小父类方法的访问权限1.2 对象的多态性:父子类对象的转换,分为两种:...
2019-10-12 23:03:50 280
原创 Endnote资料
官网:https://endnote.com/视频资料:https://www.youtube.com/watch?v=uXBLVPPs4Ow基于国家标准的 EndNote 输出样式模板:https://endnote.com/style_download/chinese-standard-gb-t7714-numeric/https://cnzhx.net/blog/endnote-out...
2019-05-28 17:25:09 369
原创 Plan
Period of timeplan4.14 - 4.17 学习RNN与LSTM ,就为什么用RNN,LSTM,优缺点以及long dependence等方面进行了学习,已完成4.18 - 4.201. evaluate机制 2. 实现用LSTM版本的code-suggestion(即将sequence embedddin为一个vector,送入softma...
2019-05-21 11:37:50 162
原创 the structure of paper
老师,我想讨论一下论文框架,我该什么的思路来写文章?下面是我的初步框架。文章目录题目 build language model for source code1.绪论2. 理论基础2.1编译过程2.1.1词法分析2.2 语法分析2.3抽象语法树2.2 基于代码的语言模型2.2.1 显式模型(n-gram)2.2.2 隐式模型(NN)2.3 决策树3. DT+模型3.1GenRule3.2 DT+...
2019-05-17 10:02:40 463
原创 谈话小结
2018/12/27,周四漫漫读博路今天和zhouyu老师谈了一下,主要是我科研能力尚不完善,看论文get不到key point,导致别人问这篇文章讲了什么的时候,我只有说了具体的实现过程,没有铺垫,核心思想等等。1.前期调研也就是一开始mentor指了方向,比如说source code上的language model,然后就应该广泛的去搜集资料,也就是查文献,怎么查呢?这个领域的高引...
2019-05-14 09:53:38 287
原创 summary(5.1- 5.9)
1. the token we‘re going to predict####1 .1 for block range(?)for 结构一般都是for what in range(what) 或者 for what in what。 对于第一种大多是取此for结构上的一个被赋予constant的field variable,或者len(某个dict或者list)1 .2 for bl...
2019-05-09 16:09:08 612
原创 python爬取网上的图片
1.simple version网站没有反扒机制的:import urllib.requestimport reurl="http://ohhappyday.com/" # 1.我们要爬取图片的地址page = urllib.request.urlopen(url) # 2. 打开网址 print(page)html = page.read().decode("utf-8") # 3....
2019-04-30 14:15:43 734
原创 summary4.27 - 28
1. loss各种参数下的loss2. Ranking metrics之前说过NDCG是对order敏感的Ranking metrics,基于两个前提:我们希望把最相关的结果放到排名最靠前的位置,因为大部分用户都是从上往下阅读的,那么最相关的在前面可以最大程度减少用户的阅读时间;我们希望整个列表的结果尽可能的和query相关;NDCG允许相关值是实数值。MAP(Mean Avera...
2019-04-28 22:21:17 317
原创 summary[4.21-4.26]
1. tree -> sequence一个node由type,value和children三个属性,没有value的用empty表示,叶子节点不需要由children,比如x = 7的AST的 sequence2. NN model采用Encoder- decoder的结构2.1 EncoderEncoder主要是LSTM与Attention mechanism.1.先对no...
2019-04-26 14:28:48 231
原创 pycharm 远程连接
https://blog.csdn.net/duankaifei/article/details/41898641注意:2. connect的时候主机地址与 使用sshpycharm Failed to trasfer file xxx. could not write to xxx (Permission denied)问题...
2019-04-23 12:38:40 352
原创 python3 json的读取与存储
1.python读取.json格式文件到dict中简单来说:读取json文件需要用json.load转码,保存字典文件为json格式需要用json.dump转码数据文件:student.json{"name": "张三", "age": 13}{"name": "李四", "age": 14}读取上述文件并保存在字典中,如果直接读取# -*- coding: utf-8 -*-i...
2019-04-19 11:14:45 2361
转载 玩转AST
https://github.com/upsuper/blog/commit/0214fdd084c4adf2de2ed9912d644fb59ce13a1c +Title: [翻译] AST 模块:用 Python 修改 Python 代码+Date: 2012-03-03 16:47+Tags: PythonCategory: TechniqueSlug: static-modi...
2019-04-18 21:08:29 449
原创 summary(4.8-4.18)
1. evaluate1.1 accuracy --> precision & recall --> F-scorce对于垃圾邮件识别,如果有10封邮件,9封垃圾邮件,如果我们全识别成垃圾邮件,那么accuracy = 9 /10 =90%,这样的准确率虽然比较高,但是造成的后果所有的邮件被拦截,如果某一地区有了流行性疾病,10个人中有8个患病,那医院全都诊断所有人患病,这...
2019-04-18 20:38:02 399
原创 torch. nn.Softmax(dim=1)
torch. nn.LogSoftmax(dim=2), 则对dim=2进行softmax,dim =0,1,2到底代表什么没意思?
2019-04-15 20:12:29 17253 2
原创 re.sub
关于re.sub里面有\number的含义如果我想把字符串“foobar”替换成foohibar可以用>>> re.sub(r'(foo)', r'\1hi', 'foobar')###结果 'foohibar'但是如果想r用foo123bar替换fooba>>> re.sub(r'(foo)', r'\1123', 'foobar')'J3ba...
2019-04-15 16:54:12 1770
原创 Probability distribution 概率分布
参考; wikipedia / Probability_distributionⅠ概率分布 (probability distribution)在probability theory 和 statistic(统计学)中,probability distribution 就是 mathematical function。probability distribution 提供了experience...
2019-04-02 16:47:07 6941 2
原创 terms(sentence and Phrases)
1. sentencehttps://www.englishclub.com/grammar/sentence/what-is-a-sentence.htmhttps://learnenglish.britishcouncil.org/english-grammar/sentence-structureIn simple terms, a sentence is a set of words...
2019-04-02 10:00:32 364
原创 what is the different between Grammar and syntax
A grammar is a series of productions that generate the valid “words” of a language. It is a way to specify the syntax of a language. Another way to specify the syntax would be using plain English, bu...
2019-04-01 20:05:55 3116
原创 抽象语法树(AST)
这是一段代码片段(code snippet)int a = 1如果我们像想要execute , analyze or format it.我们就必须将code snippet transform成我们某种data transform.Now, if we want to do anything with this program (executing it, analyzing it,...
2019-04-01 17:22:59 547
原创 tiger-chapter 3 Parsing
chapter 3 Parsing3.1 context-free grammars 上下文无关文法3.1.1 derivation推导3.1.2 Parse tree3.1.3 ambiguous grammar3.1.4 文件结束符 end od file market3.2 预测分析 predictive parsing3.2.1 first 和 follow集 FIRST and FO...
2019-04-01 13:56:00 320
原创 summary(3.18-3.29)
summaryⅠImplementation of modern compilation principleschapter 1 Introductionchapter 2 Lexical AnalysisⅡ implement paperⅢ language modelⅠImplementation of modern compilation principleschapter 1 Intr...
2019-04-01 11:49:52 357
转载 Eclipse JDT--AST入门
转载:https://blog.csdn.net/flying881114/article/details/6187061#commentBox 最近做program analysis,需要解析Java的源代码,于是就去看了看Abstract Syntax Tree(AST,中文为抽象语法树)。有点无奈的是,...
2019-03-28 21:13:20 366
原创 语法树与抽象语法树(parse tree & abstract syntax tree)
1 语法树(parse tree):是在parsing阶段,derivation的图像化表示,parser tree focus on grammar的actual implemment,包括像white spaces, braces, keywords, parenthesis 等一些细节。 “parse tree” 也叫 “concrete syntax tree” ,它represents...
2019-03-28 14:34:13 20661 7
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人