机器学习
文章平均质量分 92
彩虹糖梦
A penny for my thoughts, oh no I’ll sell them for a dollar. They're worth so much more after I’m a goner.
展开
-
Variational Auto-Encoder 变分自编码器详解
在我最近研读各种文献的过程中,变分自编码器(VAE)经常出现在各种方法中,往往紧接着VAE之后,就是一串我看不懂的公式。后来,我找到了VAE的原始文献,Auto-Encoding Variational Bayes,直接被劝退,实在是太难以理解了。直到最近,又看了几篇讲解VAE的文章,看了几个视频,请教了几位同学,感觉对VAE的理解深入了那么一点点,所以决定把这些理解永久地保存在博客上。下一步的目标是读懂Representation Learning with Contrastive Predictive原创 2021-01-14 15:44:39 · 1248 阅读 · 0 评论 -
强化学习:DDPG到MADDPG
本文主要关注于强化学习中基于策略梯度的方法。首先会简要介绍什么是策略梯度,什么是Actor-Critic算法,之后会重点讲述DDPG(Deep Deterministic Policy Gradient)算法,以及DDPG的多智能体版本:MADDG(Multi-agent Deep Deterministic Policy Gradient)。策略梯度(Policy Gradient)与基于策略梯度(Policy Based)的方法相对应的,是基于动作价值函数(Value Based)的方法。我们熟原创 2020-12-10 10:52:54 · 10485 阅读 · 8 评论 -
无监督机器翻译
0. 导言本博客源自本学期研究生的课程作业,需要针对某个指定的领域做Presentation,在写此博客之前,我对机器翻译一无所知,如后续出现任何错误,欢迎各位大佬不吝指正。本文大概分为三大部分,第一部分简单介绍机器翻译和无监督机器翻译。第二部分介绍最先取得良好效果的无监督机器翻译模型。第三部分会介绍近两年无监督机器翻译发表在顶会的进展。1. 概述1.1 机器翻译所谓机器翻译,就是利用机器的力量来做从一种自然语言(源语言)到另一种自然语言(目标语言)的自动翻译。传统的机器翻译算法依赖于对齐的原创 2020-11-09 19:41:47 · 1911 阅读 · 0 评论 -
机器学习课程笔记(一)导论
符号与名词定义有监督学习的输入被称作input variables, features, attributes,有监督学习的输出被称作output,variables,targets,输入+输出被称作training example,instance。所有的输入输出对的集合被称作training data set。 我们用代表输入,代表输出。有监督学习的过程为了找到一个函数。在这里是的一个good predicator。h被称为hypothesis。 有监督学习问题是按照输出进行分类的 输出是实.原创 2020-10-03 17:24:28 · 351 阅读 · 0 评论 -
论文笔记:Generative Adversarial Imitation Learning
继续我们上篇博文模仿学习概述中的内容,上文中我们讲到,模仿学习中的逆向强化学习和对抗神经网络如出一辙,在本文中,我们就继续分析将对抗神经网络和逆向强化学习结合遇到的困难和所提出的解决方法。背景在上文模仿学习概述中讲过,模仿学习目前分为两个大类,一类是“行为克隆”,一类是“逆向强化学习”,前者可以看作是一种有监督的学习,根据输入的State,输出的Action,通过神经网络进行训练,这...原创 2020-01-15 11:13:39 · 1200 阅读 · 1 评论 -
模仿学习(Imitation Learning)概述
本篇文章是基于台大李宏毅老师的课程写的,如有疏漏,请看原课程。https://www.youtube.com/watch?v=rl_ozvqQUU81. 什么是模仿学习?模仿学习(Imitation Learning)也被称为基于演示的学习(Learning By Demonstration)或者学徒学习(Apprenticeship Learning)。机器是可以与环境进行交互的,但...原创 2019-12-30 16:02:55 · 23470 阅读 · 1 评论 -
论文笔记:代码语义的表示(Neural Code Comprehension: A Learnable Representation of Code Semantics)
论文概况论文链接:Neural Code Comprehension: A Learnable Representation of Code Semantics论文作者:Tal Ben-Nun,Alice Shoshana Jakobovits,Torsten Hoefler论文来源:32nd Conference on Neural Information Processing...原创 2019-03-18 20:09:28 · 2854 阅读 · 0 评论 -
论文笔记:使用AI检测代码缺陷(Towards security defect prediction with AI)
Towards security defect prediction with AI 文章基本概况作者:Carson D. Sestili,William S. Snavely, Nathan M. VanHoudnos。三位作者均来自卡内基梅隆大学。时间:2018年8月提交到了arXiv。原文链接:Towards security defect prediction with...原创 2018-12-08 15:13:15 · 4432 阅读 · 1 评论 -
用于代码缺陷检测的数据集生成
用于代码缺陷检测的数据集生成论文地址:Towards security defect prediction with AI代码仓库地址:sa-bAbI运行环境:阿里云 Ubuntu 16.04权限:root阿里云下的Ubuntu什么东西都要现安装。apt-get updateapt-get install git切换到根目录cd /下载代码仓库git clone https:...原创 2018-11-30 11:44:13 · 2317 阅读 · 1 评论 -
模式识别数学基础——线性代数部分
模式识别线性代数相关的知识点,包括矩阵的乘法,逆运算,逆,求解特征值和特征向量等内容。原创 2018-11-16 21:12:25 · 906 阅读 · 0 评论 -
Company Upstream and Downstream Analysis
Company Upstream and Downstream AnalysisBackground- Listed companies regularly disclose annual reports in each quarter to disclose the company’s operating conditions. But these reports are too ...原创 2018-11-07 22:30:44 · 1757 阅读 · 0 评论 -
matlab实现线性回归成绩预测
目的1. 熟悉matlab基本语法。2. 使用matlab进行绘图。3. 复习线性回归于梯度下降。数据集与之前的文章,朴素贝叶斯实现成绩等级分类相同,也是某市一模考试成绩(只保留了语文英语数学和总分)假设函数等号的左侧代表预测的成绩,左侧(θ0,θ1,θ2,θ3)代表参数,考虑到成绩的实际情况,可以将θ0定义为0,因此要求的参数列表为(θ1,θ2,θ3)。x1,x2...原创 2018-09-29 23:33:34 · 13138 阅读 · 8 评论 -
遗传算法解决推箱子问题
遗传算法遗传算法(Genetic Algorithm)是一类借鉴生物界的进化规律(适者生存,优胜劣汰遗传机制)演化而来的随机化搜索方法。最早听说这个算法是在一门公选课上,当时了解的还包括蚁群算法等。总之,这种算法通过模拟自然界物种的繁衍,来寻找适宜生存的种群,达到寻找相对优解的过程。这种方法可以很好的避免我们的算法找到局部最优解之后就停滞不前。推箱子问题推箱子相比大家都玩过,在地图上,...原创 2018-10-04 15:39:18 · 1851 阅读 · 1 评论 -
论文笔记:时间序列分析
论文笔记:Causal Inference on EventSequences论文综述解决的问题:两个不同的序列xn与yn,是否能断定他们相互关联,或者说存在因果关系。依托的主要知识:概率论名词解释:格兰杰因果关系 Granger causality 统计学上的因果关系:从统计的角度,因果关系是通过概率或者分布函数的角度体现出来的:在宇宙中所有其它事件的发生情况...原创 2018-07-16 20:16:44 · 5877 阅读 · 2 评论 -
深度学习数学基础笔记整理(二)
原创 2017-11-09 16:41:38 · 384 阅读 · 1 评论 -
深度学习数学基础笔记整理(一)
原创 2017-11-09 16:37:46 · 1922 阅读 · 0 评论 -
朴素贝叶斯分类器实现成绩等级预测
最近在学习机器学习相关的算法,希望能通过笔记和做的小的Demo来巩固一下所学的知识和算法。 今天来讲解一下朴素贝叶斯分类器,并利用朴素贝叶斯做一个简单的成绩等级预测。 贝叶斯决策论:在所有相关概率都已知的理想情形下,贝叶斯决策论考虑如何基于这些概率和误判损失来选择最优的类别标记。 而朴素贝叶斯分类器采用了“属性条件独立性假设”(attribute conditional...原创 2017-09-15 11:53:40 · 8828 阅读 · 3 评论