lloyd_chou-CSDN博客

原创汉女【邱子】

汉女【2021-08】久闻西湖水，今得一亲临水光潋滟好，江寒碧玉深宋声尽吹散，越角成空吟江山自兹变，佳人可听闻无边水茫茫，淡淡寒烟生行人弄叽喳，不闻汉女声汉女觅难寻，芳草谁与共物我合一处，泠然暂忘形...

2022-04-23 12:51:47 124

大数据系统大体可以分成以下四个部分：1，数据采集层2，数据计算层3，数据服务层4，数据应用层下图是阿里巴巴大数据系统架构图：一、数据采集层数据采集主要分成以下三块数据：1，Web 端日志2，App 端日志3，第三方数据（比如 mysql 增量数据同步）Web 端和 App 端的日志数据都需要制定各个场景下的埋点规范，用来满足各种通用业务场景下（比如浏览、点击等）的数据分析。Web 端和 App 端数据采集一般都有各自的埋点 SDK 和对应的埋点管理平台，用来确保埋点数据的规范和准

2022-04-22 15:34:28 2609

原创 VAE新解（下）

1，框架构建还记得上篇提到的隐含变量Z吗？这个Z就是决定最终x形态的隐含变量。给定一个图片Xk，我们假定p(Z|Xk)是专属于Xk的后验概率分布，这个概率分布服从正态分布。得到了这个概率，我们可以从分布中采样，并且通过最终的解码器将图片再恢复出来。可以看到encoder部分做的事情就是，对相应的输入数据，通过网络（两个dense层）产生了均值和方差。为了使模型具有生成能力，VAE 要求每个 p(Z) 都向正态分布看齐。2，重参数技巧在实际应用过程中，z的值是一个随机变量，反向传播中，我们没有办

2022-04-22 13:52:25 346

原创 VAE新解（上）

vae初识vae,全称variational auto encoding。假设我们用一堆特征如，smile，beard，gender，glass等刻画一张人脸。我们把这些特征one-hot后，送入网络学习。最终得到这些参数特征。而我们vae最终学习的就是这些隐含的参数特征。当然这是假定人类头像服从高斯分布。事实上也是如此。人以类聚，物以群分。相同的事物存在一定的分布特征，这也是大自然的奇妙之处！VAE和GAN假如我们只有一堆样本，没有上面所说的一系列特征，怎么办。我们无法找到相应分布，无法计算k

2022-04-22 13:19:28 618

原创 flink调优

这里写自定义目录标题欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入欢迎使用Markdown编辑器你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Mar

2021-11-30 17:23:33 2669

原创如何去除填充对模型的影响

1、mask*负无穷大数，softmax归一化后等于0def scaled_dot_product_attention(q, k, v, mask): """计算注意力权重。 q, k, v 必须具有匹配的前置维度。 k, v 必须有匹配的倒数第二个维度，例如：seq_len_k = seq_len_v。虽然 mask 根据其类型（填充或前瞻）有不同的形状，但是 mask 必须能进行广播转换以便求和。参数: q: 请求的形状 == (..., seq_len_q,

2021-10-20 17:23:19 168

原创交叉商Cross-Entroy

交叉熵描述了两个概率分布之间的距离，当交叉熵越小说明二者之间越接近。尽管交叉熵刻画的是两个概率分布之间的距离，但是神经网络的输出却不一定是一个概率分布。为此我们常常用Softmax回归将神经网络前向传播得到的结果变成概率分布。softmax常用于多分类过程中，它将多个神经元的输出，归一化到( 0, 1) 区间内，因此Softmax的输出可以看成概率，从而来进行多分类。假设我们有一个包含k个元素的数组V，i表示V中的第i个元素，那么这i个元素的softmax输出就是:简单复习了Softmax，开始进入

2021-10-11 17:48:04 265

原创 sparse_softmax_cross_entropy_with_logits详解

函数：tf.nn.sparse_softmax_cross_entropy_with_logits(logits=x, labels=y)作用：计算logits和labels之间的稀疏softmax交叉熵，该函数为常用函数。函数：tf.nn.softmax_cross_entropy_with_logits(logits=x, labels=y)作用：计算logits和labels之间的softmax交叉熵，该函数为不常用函数区别：softmax_cross_entropy_with_logits

2021-10-11 10:47:15 1943

原创 epoll詳解

epoll是在2.6内核中提出的，是之前的select和poll的增强版本。相对于select和poll来说，epoll更加灵活，没有描述符限制。epoll使用一个文件描述符管理多个描述符，将用户关系的文件描述符的事件存放到内核的一个事件表中，这样在用户空间和内核空间的copy只需一次。一 epoll操作过程epoll操作过程需要三个接口，分别如下：int epoll_create(int size)；//创建一个epoll的句柄，size用来告诉内核这个监听的数目一共有多大int epoll_ct

2021-08-01 20:36:05 179

原创空洞卷积詳解

空洞卷积Dilated/Atrous Convolution(中文叫做空洞卷积或者膨胀卷积) 或者是 Convolution with holes 从字面上就很好理解，是在标准的 convolution map 里注入空洞，以此来增加 reception field。相比原来的正常convolution，dilated convolution 多了一个 hyper-parameter 称之为 dilation rate 指的是kernel的间隔数量(e.g. 正常的 convolution 是 dilat

2021-08-01 20:27:31 853

原创快手推荐精排模型的发展史

1、参数个性化 CTR 模型 - PPNet　　2019 年之前，快手 App 主要以双列的瀑布流玩法为主，用户同视频的交互与点击，观看双阶段来区分。在这种形式下， CTR 预估模型变得尤为关键，因为它将直接决定用户是否愿意点击展示给他们的视频。彼时业界主流的推荐模型还是以 DNN、DeepFM 等简单的全连接深度学习模型为主。但考虑到某用户个体和视频的共建语义模式在全局用户的共建语义模式基础上会有个性化的偏差，如何在 DNN 网络参数上为不同用户学习一个独有的个性化偏差成为了快手推荐团队优化的方向。在.

2021-07-29 12:39:14 2380

原创 tensorflow Serving架构详解和代码示例

1、参数个性化 CTR 模型 - PPNet　　2019 年之前，快手 App 主要以双列的瀑布流玩法为主，用户同视频的交互与点击，观看双阶段来区分。在这种形式下， CTR 预估模型变得尤为关键，因为它将直接决定用户是否愿意点击展示给他们的视频。彼时业界主流的推荐模型还是以 DNN、DeepFM 等简单的全连接深度学习模型为主。但考虑到某用户个体和视频的共建语义模式在全局用户的共建语义模式基础上会有个性化的偏差，如何在 DNN 网络参数上为不同用户学习一个独有的个性化偏差成为了快手推荐团队优化的方向。在.

2021-07-26 19:24:54 1289

原创 yolo3的损失函数

xy_loss = object_mask * box_loss_scale * K.binary_crossentropy(raw_true_xy, raw_pred[...,0:2], from_logits=True)wh_loss = object_mask * box_loss_scale * 0.5 * K.square(raw_true_wh-raw_pred[...,2:4])confidence_loss = object_mask * K.binary_crossentropy(o.

2021-07-26 18:37:16 377

原创天下大道编程

能够解决问题固然是一种能力，但这还远远不够。事实上，提出一个很好的问题，才能反映出自己的水平。一个优秀的工程师，不仅要能解决问题，更能思考一些问题。如若不然，即使编程有十几年的经验，仍然只是一个码农，而绝非一个工程师。所谓工程师，自然就是一个相对比较优秀的人。本质上是优秀的人，而后才是工程师，是学者，是专家。凡是优秀的人，具有的优秀特质，或者说性格特质，他们都是拥有的。编程，只是他们为了达到优秀，为了明心现性，为了性格的完善，而进行的修炼，或者说磨炼。正如跑步可以磨炼意志，强身健体一样。都只是方法，是途径

2021-07-26 18:17:27 63

原创沁园春·上海

沁园春·上海 2019.7天际压城，黑云密布，骤雨滂滂。望小荷摇曳，百花争放；大江东去，浊浪激昂。高楼低垂，行人欲上，万物换颜比淡妆。萧萧处，共金樽把酒，睥睨八荒！建功立业正当。驭王道，封国还故乡。看南阳光武，挥戈定鼎；井冈毛主，策马安邦。叱咤风云，经天纬地，堪负中华好儿郎。人间世，又再翻风雨，光照四方！...

2021-07-26 18:14:53 215

原创 glove词向量

词向量的表示可以分成两个大类1：基于统计方法例如共现矩阵、奇异值分解SVD；2：基于语言模型例如神经网络语言模型(NNLM)、word2vector(CBOW、skip-gram)、GloVe、ELMo。 word2vector中的skip-gram模型是利用类似于自动编码的器网络以中心词的one-hot表示作为输入来预测这个中心词环境中某一个词的one-hot表示，即先将中心词one-hot表示编码然后解码成环境中某个词的one-hot表示(多分类模型，损失函数用交叉熵)。CBOW是反过来的，分别用环

2021-07-26 18:05:26 221

原创推荐系统-FM详解

最近学习了一种叫做 Factorization Machines（简称 FM）的算法，它可对任意的实值向量进行预测。其主要优点包括: 1) 可用于高度稀疏数据场景；2) 具有线性的计算复杂度。本文将对 FM 框架进行简单介绍，并对其训练算法 — 随机梯度下降（SGD）法和交替最小二乘（ALS）法进行详细推导。相关链接：（一）预测任务（二）模型方程（三）回归和分类（四）学习算法 ...

2021-06-06 20:46:00 506

原创大数据中间件kafka的设计哲学

1，kafka是基于多分区多副本的分布式消息系统。一个topic对应多个partition，每个partition又由一个一个消息组成。每个消息都被标识了一个递增序列号代表其进来的先后顺序，并按顺序存储在partition中。这样，消息就以一个个id的方式，组织起来。producer选择一个topic，生产消息，消息会通过分配策略append到某个partition末尾。consume...

2019-07-08 18:53:24 222

原创 consul集群和服务发现

创建集群：1个client，3个server docker run -d --name=consul1 -p 8900:8500 -e CONSUL_BIND_INTERFACE=eth0 consul agent --server=true --bootstrap-expect=3 --client=0.0.0.0 -ui docker run -d --name=consul2 -e C...

2019-06-17 15:18:34 251

原创 zk集群和clickhouse集群搭建

第一步搭建zk集群stack.xmlversion: '3.1'services: zoo1: image: zookeeper restart: always hostname: zoo1 ports: - 2191:2181 environment: ZOO_MY_ID: 1 ZOO_SERVERS: se...

2019-06-14 18:55:04 3969

原创红黑树浅析

介绍红黑树是一个平衡的二叉树，但不是一个完美的平衡二叉树。虽然我们希望一个所有查找都能在~lgN次比较内结束，但是这样在动态插入中保持树的完美平衡代价太高，所以，我们稍微放松逛一下限制，希望找到一个能在对数时间内完成查找的数据结构。这个时候，红黑树站了出来。阅读以下需要了解普通二叉树的插入以及删除操作。红黑树是在普通二叉树上...

2019-02-09 17:24:08 123

转载简单透彻理解JSONP原理及使用

什么是JSONP首先提一下JSON这个概念，JSON是一种轻量级的数据传输格式，被广泛应用于当前Web应用中。JSON格式数据的编码和解析基本在所有主流语言中都被实现，所以现在大部分前后端分离的架构都以JSON格式进行数据的传输。那么JSONP是什么呢？首先抛出浏览器同源策略这个概念，为了保证用户访问的安全，现代浏览器使用了同源策略，即不允许访问非...

2018-07-02 18:27:26 142

原创 setTimeOut浅析

setTimeout,前端工程师必定会打交道的一个函数.它看上去非常的简单,朴实.有着一个很不平凡的名字–定时器.让年少的我天真的以为自己可以操纵未来.却不知朴实之中隐含着惊天大密.我还记得我第一次用这个函数的时候,我天真的以为它就是js实现多线程的工具.当时用它实现了一个坦克大战的小游戏,玩儿不亦乐乎.可是随着在前端这条路上越走越远,对它理解开始产生了变化.它似乎开始蒙上了面纱,时常有一些奇怪的表

2018-01-24 21:07:01 216

转载 Go语言错误处理

Go语言错误处理十月 30, 2015 7 条评论近期闲暇用http://golang.org‘]);”>Go写一个lib，其中涉及到error处理的地方让我琢磨了许久

2017-07-10 19:16:04 444

转载搭建一个简单的Go Web服务器

序言由于本人一直从事Web服务器端的程序开发，所以在学习Golang也想从Web这里开始学起，如果对Golang还不太清楚怎么搭建环境的朋友们可以参考我的上一篇文章 Golang的简单介绍及Windows环境下安装、部署，这一篇我们来了解一下Golang的Web开发入门：搭建一个简单的Go Web服务器。注：此文借鉴了Astaxie《Go Web编程》一书中的内容正文Go语言标准库 - net/h

2017-07-10 18:47:12 525

转载 Go语言基础：make，new, len, cap, append, delete方法

前面提到不少go的内建函数，这篇文章学习下如何使用。。make先拿 make 开刀，可是一开始我就进入了误区，因为我想先找到他的源码，先是发现 src/builtin/builtin.go 中有 func make(Type, size IntegerType) Type ，可是这里只有两个参数，跟我所了解的 make 是个可变参数不太一样，于是我继续搜索源码包是否还有其它 make 函数原型的

2017-07-06 08:50:37 415

原创英语学习文章

1，苹果成首家市值超8000亿美元公司

2017-05-21 21:45:39 207

转载比较ArrayList、LinkedList、Vector

翻译人员: 铁锚翻译时间: 2013年12月2日原文链接: ArrayList vs. LinkedList vs. Vector1. List概述List,就如图名字所示一样,是元素的有序列表。当我们讨论List时，将其与Set作对比是一个很好的办法,Set集合中的元素是无序且唯一的。下图是Collection的类继承图,从图中你可以对本文所讨论的知识有大致的了解.图12. Arra

2017-05-19 18:24:26 178

原创 C的学习笔记

1，int，long int 分配的都是4个字节；float，4 ；double，8；long double，16个字节。像3.1415926默认是double型数据；

2017-05-12 20:39:37 245

原创 gdb 调试

1，如何生成可以调试的可执行文件gcc -g summary.c -o sum

2017-05-12 11:39:19 185

qq_25864747的博客