SpadeA_Iverxin-CSDN博客

原创【计算广告学习笔记】1. 广告的计价方式和常用缩写

计算广告基础术语记录

2022-08-13 21:48:18 802 1

原创论文阅读-Multi-gate Mixture-of-Experts(MMOE)

MMOETittle总结：针对的问题：多任务学习，目的是通过构建一个模型，能够用在不同目标或者任务上。但是这种模型的预测质量往往对于任务之间的关系很敏感。产生的新想法：提出了Multi-gate Mixture-of-Experts(MMoE)，多门控制的混合专家网络。在MoE(专家网络)的基础上，通过在任务间共享专家网络的子模型，来使MoE适应多任务学习。例如，在电影推荐系统中，通常需要同时优化多个目标，例如同时预测用户的购买率、用户的打分等。研究表明迁移学习可以通过

2021-09-27 08:51:11 663

原创 2.机器学习复习笔记-各种评估指标

文章目录准确率（Accuracy）精确率(Precision)、召回率（Recall)、PR曲线。F1 ScoreRMSEROCPR曲线和ROC曲线对比余弦距离、欧氏距离、KL距离准确率（Accuracy）acc=numcorrectnumallacc = \frac{num_{correct}}{num_{all}}acc=numallnumcorrect既正确的数量除以错误的数量。准确率这个指标的短板在于训练数据是否偏斜。以二分类为例，当正样本数量占5%，而负样本数量占95%时，即使模

2021-07-06 20:49:27 466 2

原创 0. 写在前面

最近通读了一遍《百面机器学习》这背书，里面都已以面试问题的形式提出的，但是书籍整体脉络清晰，速读一遍后让自己对知识体系和一些问题的细节得以重新思考，收获颇丰。第二遍精读，将随手记录笔记，写在这个系列中，并对一些内容进行进一步的详细扩充。如果你对机器学习有一定的基础，建议读一下这本书，可能会有不一样的收获。...

2021-06-01 10:57:58 138

原创 1. 特征工程相关（1）

文章目录特征工程（1）1. 方法概述：2.1 数据清洗2.1.1 数据缺失值2.1.2 噪声处理2.2 归一化2.3 特征编码Reference特征工程（1）特征工程是机器学习中十分重要的一环，特征工程做的好坏往往对模型的效果有着直接的影响。本篇总结了一些常见的特征工程方法和适用情况，并对原理进行简要分析。1. 方法概述：数据清洗：主要对数据的缺失值进行填充和噪声进行处理。归一化：统一数据范围，加快梯度下降。特征编码：对特征进行数据化描述。特征组合：把一些特征进行组合，从

2021-06-01 10:54:56 171

原创 SVM算法原理和python代码实现(SMO)

SVM文章目录SVM1.基本概念：1.2 数据集：1.1 函数间隔：1.3 几何间隔：2. SMO描述算法：2.1 算法流程2.2 选择策略2.3 预测：3. 代码实现：4. Reference1.基本概念：支持向量机就是找到一个平面，能够将训练样本一分为二。可见SVM是用于二分类的。如果存在这么个平面能够将样本一分为二，没有任何误差，就叫做线性可分。如果有个别的分错了，就叫做线性不可分。1.2 数据集：T={(x1,y1)...(xN,yN)}T = \{(x_1,y_1)...(x_N,

2021-05-07 20:28:34 1416

原创论文阅读：Attention is all you need、Attention原理

[TOC]这篇文章可以说是把Attention机制发扬光大的文章。提出了一个交Transformer的模型，对，就是变形金刚的那个transformer。Transformer模型只使用注意力机制（Attention mechanisms）来实现Encoder和Decoder，没有使用其他的RNN或者CNN。Transformer模型是一个Seq2Seq的模型，即输入是一个序列，输出也为一个序列。模型架构：从模型架构上来看，主要有以下几个部分：左侧是Encoder，右侧是Decoder，他们主

2021-04-23 21:26:48 958 9

原创论文阅读 - 特征提取-Concrete Autoencoders: Differentiable Feature Selection and Reconstruction（2017）

文章目录干货部分概述与目标方法描述Concrete Selector LayerConcrete random variablesConcrete selector Layer训练伪代码：其他笔记（湿货部分）特征选择方法分类（同西瓜书11章-11.2/11.3/11.4）：Filter(过滤式)：Wrapper(包裹式)Embedded（嵌入式）问题表述干货部分概述与目标特征选择的关键一步是特征选择矩阵，假设这个矩阵是Wk×nW^{k\times n}Wk×n，样本是Xn×1X^{n\times 1}

2021-03-30 21:36:39 1795 2

原创论文阅读 - Unsupervised feature selection via transformed auto-encoder（2019）

[TOC]题目概括一种特征选择器，用来移除不相关的特征，减少计算量，加速计算过程提升性能表现。结构模型分成三部分：通过深度自动编码器得到的受正交约束的indicator matrix指示矩阵。使用非负最小二乘法，获得近似的、非负的指示矩阵（算法第8部）通过指示矩阵来选择出特征选择矩阵(feature selection matrix)，并且使用K-means算法来评估模型。（算法性能评估部分）Related worksLS Laplacian score作为过滤方法。但是

2021-02-28 18:38:52 904

原创 Debian、Ubuntu、deepin等安装后常见问题及解决方案

这篇文章是躺在自己的笔记本中好几年了。有些方法针对现有的Linux版本可能过时了。但大多数都还实用。有问题留言交流~文章目录debian、Ubuntu18(部分20也适用)1.普通用户使用sbin命令并且加入到sudoers中2.更新源3.用户加入sbin命令4.安装完整版vim5.修改时间同步问题6.设置默认启动顺序7.文件夹改成英文8.设置终端快捷键9.优化桌面主题最大化最小按钮10.安装搜狗输入法:11.安装为知笔记12.wifi驱动安装13. 中文字体deepin--------1.源更新.

2021-02-27 14:46:06 1131

原创 Java泛型K V E T ?以及泛型擦除的理解

泛型的使用不多说了。详细谈谈常见通配符的区别：K V代表键值对E 代表ElementT 某个具体的Java类型，在使用时需要被指定。实际上具体是用KVET哪个字母，都一样，只是他们代表的东西是约定成成俗的，我用ABCDE可不可以呢，当然可以！？代表不确定的Java类型。通配符，多用在函数的参数声明，不加限定就时是Object及其子类。限定extends 和 super<? extends E>必须是E的子类或者E本身，如果不是，编译失败<? super

2021-02-27 00:39:43 433 1

原创 Ubuntu18编写service/systemctl启动服务

systemctl（systemd工具包中）已经逐步取代了service命令。以nginx为例。安装位置：/www/server/nginx启动位置：/www/server/nginx/sbin/nginx文件：/etc/systemd/system/nginx.service[Unit]Description=The NGINX HTTP and reverse proxy serverAfter=syslog.target network.target remote-fs.target

2021-02-21 20:25:34 3093

原创 Pytorch中LSTM与GRU的使用与参数理解

Pytorch中LSTM与GRU的使用在pytorch中，LSTM模块调用和GRU类似。下面调用以GRU为例。GRU初始化rnn = nn.GRU(input_size, hidden_size, num_layers, bias, batch_first, dropout, bidirectional)input_size: input的特征维度hidden_size: 隐藏层的宽度num_layers: 单元的数量（层数），默认为1，如果为2以为着将两个GRU堆叠在一起，当成一个GRU

2021-01-29 09:58:22 5254 1

原创论文阅读24 - VAE - Variational AutoEncoder (Auto-Encoding Variationl Bayes)

VAE一篇讲的很好的博客理论推导博客论文原文斯坦福课件上面的博客已经很好很深入了，下面记录一下我个人的直观理解。具体理论移步上面的博客。这里只是作为日后使用时的快速查阅。不具有理论推导的严谨性。1. 直观理解:第一次接触VAE还是在World Model这篇论文。VAE主要由三部分组成：Encoder 编码器，用来中间向量z分布，即p(z∣x)p(z|x)p(z∣x)z向量 Encoder的输出，Decoder的输入。可以当做降维之后的输入。p(z)p(z)p(z)Decoder

2020-11-16 14:25:44 937

原创论文阅读23 - Mixture Density Networks(MDN)混合密度网络理论分析

Mixture Density Networks最近看论文经常会看到在模型中引入不确定性(Uncertainty)。尤其是MDN(Mixture Density Networks)在World Model这篇文章多次提到。之前只是了解了个大概。翻了翻原版论文和一些相关资料进行了整理。1. 直观理解：混合密度网络通常作为神经网络的最后处理部分。将某种分布（通常是高斯分布）按照一定的权重进行叠加，从而拟合最终的分布。如果选择高斯分布的MDN，那么它和GMM（高斯混合模型 Gaussian Mixtu

2020-11-14 16:02:49 7055

原创 RL论文阅读22 - MB - World_Model

RL论文阅读-World_Model写博客一年多了，当初拍脑袋想写个博客记录一下自己的学习历程，也算不辜负青春年华。写了一堆字多的字少的水的不水的读得懂的读不懂的，这个刚好第100篇。继续坚持。1. TittleOnline 版本2. 标签model based3. 解析 world model这篇论文属于基于模型的强化学习(MB-RL)一种。与一些其他的MB算法不同的是，world model 算法在建模时直接使用图片帧来进行过建模。该算法在模型训练好后，可以脱离实际环境，让

2020-11-12 21:19:40 635

原创 BatchNormalization和ResNet好文收录

BatchNormalizationResNet

2020-11-06 09:35:22 179

原创 RL论文阅读21-MB-PILCO2011

1. Tittle 20112. 标签model basedplanningdata efficientcontinuous / discrete3. 总结MB类算法，一个关键问题在于减少模型的偏差。一个模型偏差过大，那么使用这个模型进行planning必然不准确。PILCO减少误差的方式是学习一个基于概率的动力学模型，并且在进行long-term planning 时，引入了模型的不确定性（model uncertainty）PILCO可以使用很少的数据并且在少数尝试之后完成

2020-11-04 09:14:44 330 1

原创最近总结和几篇好文收录

LSTM理论基础长短期记忆网络这篇博客《如何简单的理解LSTM——其实没有那么复杂》)介绍的很好英文原文《Understanding LSTM Networks》图片来自上述博客在应用的时候，我们只需要处理外部的三个变量hth_tht, ctc_tct, xtx_txtpytorch使用解析LSTM相关的有两个已经包装好的类 LSTM和LSTMCell区别在于：LSTM类的默认输入一系列时间步，然后它你能够自动处理每一层的输出，不需要手写前向传播LSTMCell是LSTM

2020-11-02 16:42:04 125

原创 RL论文阅读20 - MF类算法总结(VPG, TROP, PPO, DDPG, TD3, SAC)

PG类算法总结1. On-Policy类算法1.1 VPG：Vanilla Policy Gradienton policy 算法可用于动作空连续或者离散动作空间这个就是最初的PG版本。我们的目的是最大化有限的return。J代表的是无折扣的有限return。下面的公式推导见从PG到A3C![\nabla_{\theta} J(\pi_{\theta}) = \underE{\tau \sim \pi_{\theta}}{ \sum_{t=0}^{T} \nabla_{\theta

2020-10-19 17:23:14 2018

原创 RL论文阅读18 - MF- SAC2018(Soft Actor-Critic)

1. Tittle![image-20201015093910870](18-SAC2018(Soft Actor-Critic).assets/image-20201015093910870.png)2. LabelModel-Freeoff-policyContinuous action space微小改动policy更新规则，可以用discrete action space3. 总结SAC算法相对于DDPG来说减少了一些超参数，使得算法更容易收敛，也更加稳定。例如DDPG在训练月球

2020-10-19 17:14:19 540

原创 RL论文阅读19 - AlphaGo Zero原理浅显分析

最近偶然看到一个写轻量版（5*5）围棋的问题，当时第一时间就想到了当年（2015年吧）让世界震惊的AlphaGo。好奇心驱使，查了一下相关理论。发现AlphaGo已经被它的新一代版本AlphaGo Zero（2017）给打败了。怀着对科研前辈瞻仰的心情，浅显的研究了一下AlphaGo Zero的原理。原来，AlphaGo Zero才是真正的棋神文章目录Tittle分析：MCTS是什么东西？AlphaGo Zero后记ReferenceTittle分析：AlphaGo Zero主要是有两部分组成.

2020-10-16 21:30:21 471

原创 RL论文阅读12-mf-HER2017（更新）

[TOC]1. Tittlesource20172. 标签model-free3. 总结针对的问题：reward function的设计是很复杂的，不仅需要反映任务的本质而且还有精心设计才能够使策略最优化。稀疏奖励或者二进制奖励很难训练。提高reward是稀疏的或者是1/0的这种形式时的sample-efficiency，从而避免复杂的reward设计。解决方法：提出了一个新的技术叫做Hindsight Experience Replay。能够针对所有的off-

2020-10-16 09:56:04 561 2

原创 2020年10月14日：最近几天复现论文踩坑记录

最近踩的坑：在ddpg算法类的actor网络中输入1个state来获取action，要扩展成batch_size为1的tensor。否则出来的维度不同，导致后面计算熵出错。出错还好，就是怕不报错，就需要慢慢排查。对于target类网络，不需要使用梯度更新的，可以关掉梯度来节省内存提高速度。iterator.chain()返回的迭代器只能使用一次，for循环后将失效。需要重新创建迭代器。（因为这个原因导致critic的网络没有被更新）l1 = [1,2,3]l2 = [4,5,6]l1

2020-10-14 19:34:18 189

原创 Linux(Ubuntu18.04)docker、conda、pip源等杂记

文章目录pip修改官方源Conda安装使用更换国内源设置默认不启动（去掉终端basic）简单用法docker常用pip修改官方源Linux下创建文件 ~/.pip/pip.conf[global]index-url = http://mirrors.aliyun.com/pypi/simple/[install]trusted-host=mirrors.aliyun.com或者(win上同样适用)pip config set global.index-url http://mirrors.

2020-09-30 22:03:08 349

原创 RL论文阅读14-MB-PETS2018

1. Tittle2. 标签Model Based3. 总结3.1 针对的问题MB算法虽然能够获得很棒的sample efficienty，但是通常落后于最好的model-free。在大规模参数的函数估计器中更为明显，如神经网络。本论文就是研究如何跨越这个差距。提出了Probabilistic ensembles with trajectory sampling(PETS)。算法结合了不确定性感知深度网络动力学模型和基于采样的不确定性传播。（uncertainty-aware deep

2020-09-28 22:24:34 533

原创写在前面

本系列为笔者拜读《Head First Design Patterns》英文版笔记整理。其中代码大部分来自该书。如有理解偏差或错误请指正。

2020-09-20 19:25:52 104

原创设计模式（12）Compund Pattern 各种模式的组合使用案例

<h1 id="模式的组合使用">模式的组合使用</h1><h2 id="案例一：小鸭子">案例一：小鸭子</h2><p>这里仍然使用书中第一章的鸭子的案例。</p><p>首先创建一个“叫”的接

2020-09-20 19:21:39 204

原创 20-今日三扣(剑指Offer)-变态青蛙跳台阶(dp)-矩形覆盖(dp)-二进制1的个数(移位).md

题目描述牛客网一只青蛙一次可以跳上1级台阶，也可以跳上2级……它也可以跳上n级。求该青蛙跳上一个n级的台阶总共有多少种跳法。思路：无论怎么跳，对于n级台阶，青蛙最后一跳可能是1~n。假设青蛙对于m级阶梯的跳法有f(m)种。最后一跳是1，前面需要跳n-1级，所以此时为f(n-1)种可能。最后一条是2，前面需要跳n-2级，此时为f(n-2)种可能。…最后一条是n，则青蛙一跃而上，此时只有1种跳法故最终为f(n-1)+f(n-2)+…f(1)+1使用动态规划，自底向上的构建思路，先计算f

2020-09-18 17:02:59 144

原创设计模式（11）代理模式（The Proxy Pattern）- 2 虚拟代理和动态代理

代理模式定义为另一个对象提供一个代理或者占位符，来控制对他的访问。几个控制访问的方法：一个远程代理控制对远程对象的访问虚拟代理控制对创建成本较高的资源的访问保护代理控制对于权限资源的访问远程代理见：设计模式（11）代理模式The Proxy Pattern - 1 - 远程代理rmi虚拟代理虚拟代理用来标识一个需要昂贵代价去创建的对象。虚拟代理通常来推迟这个对象的创建，直到这个对象被需要时再创建。在被代理对象创建完成之前，虚拟代理扮演者被代理者（RealSubject）

2020-09-17 15:21:17 170

原创 OpencCV制作相框效果

思路：使用PS制作一个png格式的相框。中间为透明的。命名为wraper.png使用openCv读取wraper.png。判定通道4（alpha）是否为0。如果为0则表示透明的部分。如果为255则表示完全不透明的部分。将所有值不为0的像素点在图片中的行、列记录下来。读取要覆盖的图像src.jpg。根据第二步记录的位置坐标，将src.jpg中的图片像素替换成wraper.png的像素值。注意事项：imread()读取图片时，默认读取3个通道，即BGR通道。当读取png图片时，需要制定另一个参数

2020-09-13 22:21:15 201

原创 19-今日一扣(LeetCode)-223-两个矩形重叠面积以及融合面积计算-M

223. 矩形面积LeetCode计算两个矩形融合之后的面积。（非原题描述）题解：本体思路不是最优的，利用了之前的两个矩形重叠判断的思路。该思路也可以用来求解矩形重叠部分的面积。融合后面积 = 两个矩形的总面积 - 重叠部分面积重叠部分的面积 = x方向投影的交集长度 * y方向投影的交集长度在投影交集计算时，即计算[a,b]与[c,d]的交集的长度。手下令[a,b]域永远是左侧起点那个集合。如果不是，进行交换。class Solution { public int comput

2020-09-03 11:02:45 1372

原创 import com.sun.jdi.xxx / the import com.sun.jdi cannot be resolved 解决方案（eclipse）

环境java9+eclipse问题表现：在使用sun.jdi包时无法导入该包。the import com.sun.jdi cannot be resolved解决方案：更换jre为jdk。window->preference->java->installed JRE我的默认是安装java时一起安装的jre。添加一个新的，位置为JDK的根目录，就会出现圈6的那个。就能找到相应的包了。...

2020-08-11 18:47:59 1255 2

原创 1-剑指offer-1-剪绳子-DP-2-机器人的运动范围-DFS/BFS

1. 剪绳子题目描述Online给你一根长度为n的绳子，请把绳子剪成整数长的m段（m、n都是整数，n>1并且m>1，m<=n），每段绳子的长度记为k[1],...,k[m]。请问k[1]x...xk[m]可能的最大乘积是多少？例如，当绳子的长度是8时，我们把它剪成长度分别为2、3、3的三段，此时得到的最大乘积是18。输入描述:输入一个数n，意义见题面。（2 <= n <= 60）输出描述:输出答案。示例1输入8输出18题解分析：对于长度n的绳子，我们都进行不

2020-07-29 21:24:34 110

原创 18-今日一扣(LeetCode)-474-DP01背包-M

474. 一和零LeetCode在计算机界中，我们总是追求用有限的资源获取最大的收益。现在，假设你分别支配着 m 个 0 和 n 个 1。另外，还有一个仅包含 0 和 1 字符串的数组。你的任务是使用给定的 m 个 0 和 n 个 1 ，找到能拼出存在于数组中的字符串的最大数量。每个 0 和 1 至多被使用一次。注意:给定 0 和 1 的数量都不会超过 100。给定字符串数组的长度不会超过 600。示例 1:输入: Array = {"10", "0001&q

2020-07-29 21:21:53 117

原创 17-今日一扣(LeetCode)-416-DP01背包-M-494-DP01背包-M

416. 分割等和子集-M给定一个只包含正整数的非空数组。是否可以将这个数组分割成两个子集，使得两个子集的元素和相等。注意:每个数组中的元素不会超过 100数组的大小不会超过 200示例 1:输入: [1, 5, 11, 5]输出: true解释: 数组可以分割成 [1, 5, 5] 和 [11].示例 2:输入: [1, 2, 3, 5]输出: false解释: 数组不能分割成两个元素和相等的子集.题解思路：向01背包问题转化。本题虽然是分成两个大小相同的组。也就是说，

2020-07-28 21:11:28 177

原创 16-今日两扣(LeetCode)-62-DP-M-413-DP-M

62. 不同路径-MLeetCode一个机器人位于一个 m x n 网格的左上角（起始点在下图中标记为“Start” ）。机器人每次只能向下或者向右移动一步。机器人试图达到网格的右下角（在下图中标记为“Finish”）。问总共有多少条不同的路径？示例 1:输入: m = 3, n = 2输出: 3解释:从左上角开始，总共有 3 条路径可以到达右下角。1. 向右 -> 向右 -> 向下2. 向右 -> 向下 -> 向右3. 向下 -> 向右 -&gt

2020-07-27 11:56:06 161

原创 14-今日三扣(LeetCode)-695-DFS-M-17-回溯-M-70-DP-E

695 岛屿最大面积-M-DFS两种写法题目：LeetCode给定一个包含了一些 0 和 1 的非空二维数组 grid 。一个岛屿是由一些相邻的 1 (代表土地) 构成的组合，这里的「相邻」要求两个 1 必须在水平或者竖直方向上相邻。你可以假设 grid 的四个边缘都被 0（代表水）包围着。找到给定的二维数组中最大的岛屿面积。(如果没有岛屿，则返回面积为 0 。示例 1:[[0,0,1,0,0,0,0,1,0,0,0,0,0], [0,0,0,0,0,0,0,1,1,1,0

2020-07-26 20:51:17 136

原创 15-今日扣(LeetCode)-64-DP-M

<h2 id="64最小路径和">64.最小路径和</h2><p><a href="https://leetcode-cn.com/problems/minimum-path-sum/">LeetC

2020-07-26 20:50:14 109

原创 13-今日再两扣(LeetCode)-445-贪心-E-435-贪心-M

455. 分发饼干-ELeetCode假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。对每个孩子 i ，都有一个胃口值 gi ，这是能让孩子们满足胃口的饼干的最小尺寸；并且每块饼干 j ，都有一个尺寸 sj 。如果 sj >= gi ，我们可以将这个饼干 j 分配给孩子 i ，这个孩子会得到满足。你的目标是尽可能满足越多数量的孩子，并输出这个最大数值。注意：你可以假设胃口值为正。一个小朋友最多只能拥有一块饼干。示例 1:输入: [1,2,3], [

2020-07-25 16:38:12 113

空空如也

空空如也