自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

迷雾总会解

菩提本无树,明镜亦非台,本来无一物,何处惹尘埃

  • 博客(40)
  • 资源 (14)
  • 收藏
  • 关注

原创 在Hexo NexT主题中关闭指定文章的Table of Contents(TOC)

NexT主题中在每篇文章单独的post页面,侧边栏会根据文章的多级标题自动生成Table of Contents。不过对于有些文章,我想关闭这项功能,怎么修改呢?

2021-01-31 16:11:36 1061

原创 机器学习-63-Structured Learning-04-Sequence Labeling Problem(结构化学习-序列标注(HMM,CRF))

本章学习另一种结构化学习的方法—序列标注。也是结构化学习的最后一块内容!主要讲到了HMM,CRF,以及对前面学习的结构化支持向量机,结构化SVM在序列生成里面的应用!

2021-01-29 22:48:37 669 2

原创 机器学习-62-Structured Learning-03-Structured Support Vector Machine(结构化学习-结构化支持向量机)

本篇文章主要讲的是结构化的SVM,并且对结构化里面的一些基本理论和概念做一些基本介绍。根据这些概念,我们可以深刻的理解结构化的思想!以及对结构化SVM的基本认识!

2021-01-29 22:41:52 497

原创 机器学习-61-Structured Learning-02-Structured Linear Model(结构化学习-线性模型)

在结构化学习中,线性模型是一个很重要的模型,我们接下来的内容很多都是基于线性模型来说的

2021-01-29 22:34:21 280

原创 机器学习-60-Structured Learning-01-Introduction(结构化学习-介绍)

本文是结构化学习的开端,简单介绍一下结构化学习的概念以及要解决的三个问题!

2021-01-29 22:29:34 831

原创 机器学习-59-Support Vector Machine(SVM,支持向量机)

支持向量机(SVM)有两个特点:SVM=铰链损失(Hinge Loss)+核技巧(Kernel Method)。本文就这两个特点的原理进行深度剖析!

2021-01-29 22:18:26 582

原创 Viterbi-Algorithm(维特比算法)

维特比算法是一个特殊但应用最广的动态规划算法。利用动态规划,可以解决任何一个图中的最短路径问题。而维特比算法是针对一个特殊的图-篱笆网了(Lattice)的有向图最短路径问题而提出来的。它之所以重要,是因为凡是使用隐马尔科夫模型描述的问题都可以用它解码,包括当前的数字通信、语音识别、机器翻译、拼音转汉字、分词等。

2021-01-28 18:41:27 4149 1

原创 机器学习-58-Ensemble(集成学习:Bagging,Random Forest,Boostring,Adaboost,Gradient Boosting,Stacking)

Ensemble的方法就是一种团队合作,好几个模型一起上的方法。本文主要介绍的方法有:Bagging,Random Forest,Boostring,Adaboost,Gradient Boosting,Stacking

2021-01-26 17:20:13 575

原创 机器学习-57-Unsupervised Learning-09-More about Auto-Encoder(无监督学习之更多有关自编码器的介绍)

Auto-encoder是一个基本的生成模型,更重要的是它提供了一种encoder-decoder的框架思想,广泛的应用在了许多模型架构中。简单来说,Auto-encoder可以看作是如下的结构,它主要包含一个编码器(Encoder)和一个解码器(Decoder),通常它们使用的都是神经网络。Encoder接收一张图像(或是其他类型的数据,这里以图像为例)输出一个vector,它也可称为Embedding、Latent Representation或Latent code,不管它叫什么,我们只需要知道它是关

2021-01-25 21:50:05 513

原创 机器学习-56-RL-08-Imitation Learning(强化学习-模仿学习)

Imitation learning(模仿学习) 讨论的问题是:假设我们连 reward 都没有,那要怎么办呢?Imitation learning 又叫做 learning from demonstration(示范学习) ,apprenticeship learning(学徒学习),learning by watching(观察学习)

2021-01-25 20:10:12 1920

原创 机器学习-55-RL-07-Sparse Reward(强化学习-稀疏奖励:Reward Shaping,Curriculum Learning,Hierarchical RL)

实际上用 reinforcement learning learn agent 的时候,多数的时候 agent 都是没有办法得到 reward 的。在没有办法得到 reward 的情况下,训练 agent 是非常困难的。我们可以通过三个方向来解决 sparse reward 的问题:Reward Shaping,Curriculum Learning,Hierarchical Rl。

2021-01-25 12:10:06 1509

原创 机器学习-54-RL-06-Actor-Critic(强化学习-A2C,A3C,Pathwise Derivative Policy Gradient)

演员-评论家算法(Actor-Critic Algorithm)是一种结合策略梯度和时序差分学习的强化学习方法。在 Actor-Critic 算法 里面,最知名的方法就是 A3C(Asynchronous Advantage Actor-Critic)。

2021-01-23 22:45:07 590

原创 机器学习-53-RL-05-Q-Learning for Continuous Actions(强化学习-Q学习处理连续动作的四个方法)

Q-learning 有什么问题呢?最大的问题是它不太容易处理 continuous action。很多时候 action 是 continuous 的。本文章会详细介绍解决问题的四种方法!

2021-01-23 16:16:56 1018 1

原创 机器学习-52-RL-04-Tips of Q-Learning(强化学习-Q学习的一些技巧:Double DQN&Dueling DQN&Prioritized Reply&Multi-step等)

本片文章要讲的是训练 Q-learning 的一些 tips:Double DQN,Dueling DQN,Prioritized Reply,Multi-step(Balance between MC and TD),Noisy Net(on Action vs on Q-function),Distributional Q-function,Rainbow

2021-01-23 15:39:43 1148

原创 机器学习-51-RL-03-Q-learning(强化学习-Q学习)

Q-learning 是 value-based 的方法。在 value-based 的方法里面,我们学习的不是策略,我们要学习的是一个 critic(评论家)。 critic要做的事情是评价现在的行为有多好或是有多不好。假设有一个actor(演员) π,critic就是来评价这个actor的策略 π 好还是不好,即 Policy Evaluation(策略评估)。

2021-01-22 22:11:10 978 1

原创 机器学习-50-RL-02-Proximal Policy Optimization(强化学习-PPO-近端策略优化)

Proximal Policy Optimization,简称PPO,即近端策略优化,是对Policy Graident,即策略梯度的一种改进算法。PPO的核心精神在于,通过一种被称之为Importance Sampling的方法,将Policy Gradient中On-policy的训练过程转化为Off-policy,即从在线学习转化为离线学习,某种意义上与基于值迭代算法中的Experience Replay有异曲同工之处。通过这个改进,训练速度与效果在实验上相较于Policy Gradient具有明显提

2021-01-22 13:02:58 896

原创 机器学习-49-RL-01-Deep Reinforcement Learning(强化学习-强化学习的基本介绍 & Policy-based方法的基本介绍)

2015年2月的时候,google在nature上发了一篇用reinforcement learning 的方法来玩akari的小游戏,然后痛鞭人类2016的春天,又有大家都耳熟能详的alpha go,也是可以痛鞭人类David Silver 说 AI 就是 Reinforcement Learning+Deep Learning Deep Reinforcement Learning : AI = RL + DL

2021-01-21 23:00:04 1228 1

原创 Android-BottomNavigation的创建

BottomNavigation的创建

2021-01-21 11:40:17 253

原创 Android-Room,RecyclerView,CardView的简单使用以及数据迁移

Room,RecyclerView,CardView的简单使用以及数据迁移

2021-01-21 11:38:50 426

原创 Android-Navigation组件,参数传递以及自定义动画

Navigation组件,参数传递以及自定义动画

2021-01-21 11:36:50 1829 2

原创 Android-ViewModel & LiveData & DataBinding & ViewModelSavedState & SharedPreferences & 小案例

ViewModel & LiveData & DataBinding & ViewModelSavedState & SharedPreferences & 小案例

2021-01-21 11:35:04 309 1

原创 Android-本地化及多语言设置&固定屏幕与旋转屏幕

本地化及多语言设置&固定屏幕与旋转屏幕

2021-01-21 11:32:25 247 1

原创 Android-Activity生命周期

Activity作为Android的四大组件之一,非常的重要,也是最常用的四大组件,使用Activity必须要在AndroidManifest中进行注册,那么作为Android的基础,Activity的生命周期你是否完全掌握了呢?下面就让我们来一起回顾一下Activity的生命周期吧!

2021-01-21 11:30:31 4620

原创 机器学习-48-Life-long Learning(终生学习)

我们是否可以只用一个网络结构(注意,这里的网络结构并非是固定的。也许随着任务的需要,得自行扩展网络),在不同的任务上分别训练,使得该网络能够胜任所有的任务呢? 这就是Life-long learning 所要研究的课题。

2021-01-20 20:43:39 5573 1

原创 机器学习-47-ML-03-Metric-based Approach & Train+Test as RNN(元学习-support set和query set用于同一网络的方法)

我们有一个更疯狂的想法,能不能直接learn一个function,这个function既做了Learning,又做了Prediction。给它Training Data,它就learn好了;给它Testing Data,它就给出Testing Data的答案!

2021-01-20 13:56:13 3251 4

原创 机器学习-46-ML-02-Gradient Descent as LSTM(元学习-用LSTM做Gradient Descen)

上次说到meta learning是在训练一个learning algorithm。使用的方法是梯度下降,这次我们研究如何将这个learning algorithm看作是一个LSTM,我们通过训练这个LSTM网络来实现我们的meta learning。

2021-01-19 20:17:38 678

原创 机器学习-45-ML-01-Meta Learning(元学习)

元学习,meta-learning,又叫learning to learn,直译即为学习如何学习,从中文字面上来理解,似乎这类算法更接近人类的学习方式——触类旁通,举一反三。而传统的深度学习方法虽然功力强大,但是框架无外乎都是从头开始学习(训练),即learning from scratch,对算力和时间都是更大的消耗和考验。

2021-01-19 15:03:00 1095 1

原创 机器学习-44-Transfer Learning(迁移学习)

迁移学习指的就是,假设你手上有一些跟你现在要进行的task没有直接相关的data,那你能不能用这些没有直接相关的data来帮助我们做一些什么事情。比如说:你现在做的是猫跟狗的classifer,那所谓没有什么直接相关的data是什么意思呢?没有什么直接相关其实是有很多不同的可能。比如说input distribution 是类似的(一样时动物的图片),但是你的label是无关的(domain是类似的,task是不像的)。还有另外的一个可能是:input domain是不同的,但是task是相同的(猫跟狗的分

2021-01-18 16:05:15 1351

原创 机器学习-43-GAN-10-Evaluation(如何评价GAN模型,GAN的总结)

本文是GAN的最后一块内容,就是如何Evaluation一个GAN模型。说人话:如何评价GAN生成的图片好还不好。另外一个方面是:是否客观,因为虽然人评价结果比较准确,但是人容易受主观影响,尤其发在论文上的图片,作者肯定不会把很烂的结果摆出来。

2021-01-17 16:05:31 1521 1

原创 机器学习-42-GAN-09-Improving Sequence Generation by GAN(通过GAN提高Sequence的生成)

这篇文章主要是说Improving Sequence Generation by GAN,讲GAN在sequence generator上的应用。sequence generator的应用很多,比如机器翻译,人机对话,甚至强化学习也算是sequence generator。使用GAN进行sequence generator主要有两大部分,分别是Conditional Sequence Generation 和Unsupervised Conditional Sequenc

2021-01-17 13:47:02 686 1

原创 机器学习-41-GAN-08-Intelligent Photo Editing(智能修图,GAN+Autoencoder)

本文主要是介绍基于GAN+Autoencoder来进行智能修图。还简单介绍了高清图片处理以及图像补全技术

2021-01-16 15:11:42 1102

原创 机器学习-40-GAN-07-Feature Extraction(InfoGAN,VAE-GAN,BiGAN,Feature Disentangle(Voice Conversion))

本节主要介绍InfoGAN,VAE-GAN,BiGAN和Triple GAN,可以用于做feature extraction。还介绍了Domain-adversarial training,Voice Conversion(声音转换)以及Feature Disentangle(特征解耦)。

2021-01-16 00:04:13 1156 1

原创 机器学习-39-GAN-06-Tips for Improving GAN(改善GAN的技巧:WGAN,WGAN-GP,EBGAN,LSGAN)

这篇文章要说的是对传统的GAN进行的一些优化,为了使GAN更容易训练。比如WGAN,它在原始的GAN上面做了几点改动,成功地提升了原始GAN的表现。还有WGAN-GP,EBGAN和LSGAN。

2021-01-15 10:55:33 669

原创 机器学习-38-GAN-05-General Framework of GAN(fGAN,GAN的一般框架)

之前在讲GAN的时候,提到我们实际是在用Discriminator来衡量两个数据的分布之间的JS divergence,那能不能是其他类型的divergence来衡量真实数据和生成数据之间的差距?又如何进行衡量?(虽然在实作上用不同divergence结果没有很大差别)

2021-01-14 19:53:54 898

原创 机器学习-37-GAN-04-Unsupervised Condition GAN(无监督有条件GAN:Direct Transformation,Projection to Comon Space)

之前讲的那篇CGAN都是有监督学习,那能不能无监督学习呢?当然可以啦,大多数情况我们很难弄到一个个对应匹配的数据,比如做图片风格转换,你很难弄到同一个图片的不同种风格,里面东西还是一模一样的,再比如,你很难把一个人的声音风格转换到另外一个人声音上,因为可能你说的是中文,另外一个人说英文,找不到一模一样的发音,所以我们需要研究无监督学习,只需要两堆数据,可将某种特征从一堆转到另一堆。

2021-01-14 16:11:36 1240

原创 机器学习-36-GAN-03-Conditional GAN(有条件的GAN)

Conditional,意思是条件,所以 Conditional GAN 的意思就是有条件的GAN。Conditional GAN 可以让 GAN 产生的结果符合一定的条件,即可以通过人为改变输入的向量(记不记得我们让生成器生成结果需要输入一个低维向量),控制最终输出的结果。

2021-01-14 16:09:22 7708 4

原创 机器学习-35-GAN-02-Theory behind GAN(GAN背后的数学理论)

生成式对抗网络(Generative Adversarial Network,又称GAN,一般读作“干!”)计算机科学领域里是一项非常年轻的技术,2014年才由伊安·好伙伴教授(Ian Goodfellow,这姓氏实在是太有趣以至于印象深刻)系统地提出。但是一经提出,就引发了学术界对GAN如火如荼的研究,同时在最原始的GAN的基础上,针对不同的应用场景提出了许多GAN的变体。使用GAN网络,输入已知数据,计算机可以学习并创建全新的合成数据。Facebook AI部长Yann LeCun对GAN的评价是"Ge

2021-01-14 16:01:31 1060

原创 机器学习-34-GAN-01-Generative Adversarial Network(GAN,生成式对抗网络)

生成式对抗网络(Generative Adversarial Network,又称GAN,一般读作“干!”)计算机科学领域里是一项非常年轻的技术,2014年才由伊安·好伙伴教授(Ian Goodfellow,这姓氏实在是太有趣以至于印象深刻)系统地提出。但是一经提出,就引发了学术界对GAN如火如荼的研究,同时在最原始的GAN的基础上,针对不同的应用场景提出了许多GAN的变体。使用GAN网络,输入已知数据,计算机可以学习并创建全新的合成数据。Facebook AI部长Yann LeCun对GAN的评价是"Ge

2021-01-14 15:58:34 1564

原创 机器学习-33-Anomaly Detection(异常侦测)

Anomaly Detection,翻译为中文意思是异常侦测,异常侦测要做的就是:让机器可以知道我不知道这件事。上面引用了《论语,论证》篇,“知之为知之,不知为不知,是知也(知道就是知道,不知道就是不知道,这样才是真正的知道)”,就是让机器知道它不知道这件事

2021-01-12 16:23:38 3787

原创 机器学习-32-ELMO、BERT、GPT

ELMO、BERT、GPT背景机器是如何理解我们的文字的呢?最早的技术是1-of-N encoding,把每一个词汇表示成一个向量,每一个向量都只有一个地方为1,其他地方为0。但是这么做词汇之间的关联没有考虑,因为不同词之间的距离都是一样的。所以,接下来有了word class的概念,举例说dog、cat和bird都是动物,它们应该是同类。但是动物之间也是有区别的,如dog和cat是哺乳类动物,和鸟类还是有些区别的。后来有了更进阶的想法,称作word embedding,我们用一个向量来表示一个单.

2021-01-11 16:48:16 896

人机交互期末复习要点.pdf

人机交互复习的要点,主要包括绪论,感知和认识基础,交互设备,交互技术,界面设计,人机交互界面表示模型和实现,Web界面设计,移动界面设计,可用性与用户体验评价

2021-07-12

李宏毅机器学习作业3CNN数据testing set 和validation set

李宏毅机器学习作业3CNN数据testing set 和validation set。因为文件太大了一个放不下,所以分开放了。。。training set可以去我的资源里找找。

2020-12-19

李宏毅机器学习作业3CNN数据training set

李宏毅机器学习作业3CNN数据training set。因为文件太大了一个放不下,所以分开放了。testing set 和validation set可以去我的资源里找找。

2020-12-19

jdk1.8.0_131

JDK(Java Development Kit),即Java开发工具包,是一个编写Java应用程序的开发环境。 JDK是整个Java的核心,包括了JRE(Java运行环境)与一些Java开发工具(例如:jconsole、javac、java、javadoc、native2ascii、jar等)。JDK=JRE+Java开发工具(编译器、调试器等)。

2020-12-14

hadoop的winutils.exe及hadoop.dll文件

我的报错:Could not locate Hadoop executable: E:\big_data\hadoop-3.3.0\bin\winutils.ex hadoop的winutils.exe及hadoop.dll文件,可以用于hadoop3.3. 下载好直接将两个文件复制到我们hadoop的bin目录下就行了

2020-08-13

poedit的TM自动翻译中文zh_CN.mo词库10187条翻译

poedit的TM自动翻译中文zh_CN词库共计10187条翻译。 用来汉化wordpress主题和插件的,自动翻译省去了一条一条手动翻译的烦恼。

2020-08-03

mysql-5.7.27-winx64 压缩包.zip

mysql-5.7.27-winx64 压缩包。解压缩后还需要进行相关配置,请自行查找资料! 注意:此资源只适用于win10,64位的计算机。

2020-07-04

计算机网络知识点导图(全)

计算机网络体系结构,物理层,数据链路层,网络层,传输层,应用层。知识点覆盖全面,适合初学者,也适合学过后复习。

2020-07-04

分支限界法思想和案例(装载问题,旅行售货员问题,0-1背包问题).zip

分支限界法思想和案例(装载问题,旅行售货员问题,0-1背包问题)。算法课使用的ppt,可结合我的博客算法专栏一起看。有详细代码。

2020-07-03

回溯法思想和案例(旅行售货员问题,装载问题, 0-1背包问题,图的m着色问题).zip

回溯法思想和案例(旅行售货员问题,装载问题, 0-1背包问题,图的m着色问题)。 算法课使用的ppt,可结合我的博客算法专栏一起看。有详细代码。

2020-07-03

贪心思想和案例(活动安排问题,0-1背包问题,最优装载,哈夫曼编码,单源最短路径,最小生成树(Prim,Kruskal),汽车加油问题).zip

贪心思想和案例(活动安排问题,0-1背包问题,最优装载,哈夫曼编码,单源最短路径,最小生成树(Prim,Kruskal),汽车加油问题)。算法课使用的ppt,可结合我的博客算法专栏一起看。有详细代码。

2020-07-03

动态规划思想的介绍(矩阵连乘问题,最长公共子序列,流水线作业调度问题,0-1背包问题).zip

动态规划思想的介绍(矩阵连乘问题,最长公共子序列,流水线作业调度问题,0-1背包问题)。算法课使用的ppt,可结合我的博客算法专栏一起看。有详细代码。

2020-07-03

递归思想和案列和分治法思想的案例

递归思想和案列(阶乘函数,Fibonacci数列,Ackerman函数,整数划分问题,Hanoi塔问题)分治法思想的介绍(大整数的乘法,Strassen矩阵乘法,棋盘覆盖问题,二分搜索,快速排序,合并排序,线性时间选择)。算法课使用的ppt,可结合我的博客算法专栏一起看。有详细代码。

2020-07-03

第1章 算法概述 - 副本.ppt

算法概述(算法,程序,复杂度分析,基本结构,表示方法,NP完全性理论,最优化问题,判定问题,P类问题,NP类问题)

2020-07-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除