自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

一介北漂

老夫是青岛人,我怀念我的故乡

原创 transformer复现

""" 原始 embedding,添加 position-embedding, multihead-attention: embedding->ff(q,k,v)-->split+concat-->mask--> attention-->...

2020-06-27 12:27:54 50 0

原创 统计

样本 总体 sample population sample足够大,代表整体 sample次数足够多,代表 均值 期望 对应 加权平均 mean , averrage 平均值,算术平均 sample 代表 整体的可信度,引入置信度 dispersion 离中趋势, 方差 samp...

2020-06-05 00:16:54 32 0

原创 gbdt原理

分类,回归, 特征提取 基函数的线性组合, 训练过程产生的残差,达到数据分类或者回归的目的 每个 分类器在上个分类器残差的基础上进行迭代 ??残差基础上进行迭代什么意思 ?? 残差就是当前模型的 负梯度值 每轮迭代产生弱分类器, 弱分类器的要求是 低方差,高偏差 ??高偏差如何理解 , ...

2020-06-04 00:38:16 27 0

原创 普通算法总结

1.bfs 广度搜索 时间复杂度 O(V+E),所有节点和所有边都需要遍历,判断是否满足某个条件组合。 每条边都有两个Node,只算边的话,会有缺失,所以是 V+E 三元组,词共现 类似于有向边,从前到后,所以E=所有边的数量,即O(n3)或者O(n2); 并没有比遍历穷举快,只是另一种表现...

2020-05-07 08:33:39 68 0

原创 paper 记录

1.Hierarchical Attention Networks for Document Classification word encode char encode =>sentence encode ==>attented-sentence encode=>docume...

2020-02-23 23:00:03 39 0

原创 neural network

1.self-attention 理解:最终是要输出,假设按照输入长度输出,就要在每个位置有对所有输入有个softmax-weigth的累加。 softmax-weight 来自于 输入embedding 做k,输入embedding做v,矩阵转置相乘得到一个相同尺寸的矩阵,含义是每个位...

2020-02-23 22:59:49 46 0

原创 leetcode-406-Queue Reconstruction by Height- 根据身高重建队列

假设有打乱顺序的一群人站成一个队列。 每个人由一个整数对(h, k)表示,其中h是这个人的身高,k是排在这个人前面且身高大于或等于h的人数。 编写一个算法来重建这个队列。 注意: 总人数少于1100人。 示例 输入: [[7,0], [4,4], [7,1], [5,0], [6,1], [...

2020-02-14 16:24:27 35 0

原创 leetcode-402-remove k digits-移掉k位数字

给定一个以字符串表示的非负整数 num,移除这个数中的 k 位数字,使得剩下的数字最小。 注意: num 的长度小于 10002 且 ≥ k。 num 不会包含任何前导零。 示例 1 : 输入: num = "1432219", k = 3 输出: &q...

2020-02-13 17:20:30 40 0

原创 leetcodefe-135-candy-分发糖果

老师想给孩子们分发糖果,有 N 个孩子站成了一条直线,老师会根据每个孩子的表现,预先给他们评分。 你需要按照以下要求,帮助老师给这些孩子分发糖果: 每个孩子至少分配到 1 个糖果。 相邻的孩子中,评分高的孩子必须获得更多的糖果。 那么这样下来,老师至少需要准备多少颗糖果呢? ...

2020-02-12 16:02:04 29 0

原创 leetcode-134-gas station-加油站

在一条环路上有 N 个加油站,其中第 i 个加油站有汽油 gas[i] 升。 你有一辆油箱容量无限的的汽车,从第 i 个加油站开往第 i+1 个加油站需要消耗汽油 cost[i] 升。你从其中的一个加油站出发,开始时油箱为空。 如果你可以绕环路行驶一周,则返回出发时加油站的编号,否则返回 -1...

2020-02-11 13:43:07 38 0

原创 leetcode-996- Number of Squareful Arrays

给定一个非负整数数组 A,如果该数组每对相邻元素之和是一个完全平方数,则称这一数组为正方形数组。 返回 A 的正方形排列的数目。两个排列 A1 和 A2 不同的充要条件是存在某个索引 i,使得 A1[i] != A2[i]。 示例 1: 输入:[1,17,8] 输出:2 解释: [1,...

2020-02-10 16:36:37 58 0

原创 python 用法总结

class AttributeDict(dict): """Example of overloading __getatr__ and __setattr__ This example creates a dictionary where member...

2020-02-09 22:36:35 22 0

原创 leetcode-990-Satisfiability of Equality Equations

给定一个由表示变量之间关系的字符串方程组成的数组,每个字符串方程 equations[i] 的长度为 4,并采用两种不同的形式之一:"a==b" 或 "a!=b"。在这里,a 和 b 是小写字母(不一定不同),表示单字母变量名。 只有当可以将整数分配给变量...

2020-02-09 17:41:22 46 0

原创 数学

def mse_loss(y1,y2): return tf.reduce_mean(tf.squared_difference(y1, y2)) def arcface_loss(embedding, weights, labels, s=64., m=0.5, m3=0.1...

2020-02-08 23:11:34 47 0

原创 leetcode-841-钥匙和房间

有 N 个房间,开始时你位于 0 号房间。每个房间有不同的号码:0,1,2,...,N-1,并且房间里可能有一些钥匙能使你进入下一个房间。 在形式上,对于每个房间 i 都有一个钥匙列表 rooms[i],每个钥匙 rooms[i][j] 由 [0,1,...,N-1] 中的一个整数表示,其中 N...

2020-02-07 12:56:56 33 0

原创 leetcode-839

如果我们交换字符串 X 中的两个不同位置的字母,使得它和字符串 Y 相等,那么称 X 和 Y 两个字符串相似。如果这两个字符串本身是相等的,那它们也是相似的。 例如,"tars" 和 "rats" 是相似的 (交换 0 与 2 的位置); "ra...

2020-02-06 14:32:33 161 0

原创 leetcodee-802-find eventual safe states

在有向图中, 我们从某个节点和每个转向处开始, 沿着图的有向边走。 如果我们到达的节点是终点 (即它没有连出的有向边), 我们停止。 现在, 如果我们最后能走到终点,那么我们的起始节点是最终安全的。 更具体地说, 存在一个自然数 K, 无论选择从哪里开始行走, 我们走了不到 K 步后必能停止在...

2020-02-05 15:51:02 46 0

原创 bert

pretrain: nsp任务,调用 cls 进行训练优化 mask任务,调用sequence_embedding进行训练优化 bert+dynamic_rnn-states+fc fc->[residual_layers,fc] bert transformer+...

2020-02-04 16:36:04 92 0

原创 leetcode785-is graph bipartite 判断二分图

给定一个无向图graph,当这个图为二分图时返回true。 如果我们能将一个图的节点集合分割成两个独立的子集A和B,并使图中的每一条边的两个节点一个来自A集合,一个来自B集合,我们就将这个图称为二分图。 graph将会以邻接表方式给出,graph[i]表示图中与节点i相连的所有节点。每个节点都...

2020-02-04 12:18:12 58 0

原创 leetcode-765

N couples sit in 2N seats arranged in a row and want to hold hands. We want to know the minimum number of swaps so that every couple is sitting side ...

2020-02-03 14:10:41 69 0

原创 leetcode-743-network-delay-time

There are N network nodes, labelled 1 to N. Given times, a list of travel times as directed edges times[i] = (u, v, w), where u is the source node, ...

2020-02-02 16:49:08 35 0

原创 有招Get

ugc产品的生死命脉 做的时机要对,优酷土豆一开始是 盗版ugc模式,过早而失败, 腾讯微博做的晚而没有起色 ugc每个app开始,都是从一个垂直内容开始的, 每个垂直内容会有一个大V,带领一帮受众。之后慢慢扩散。 推荐模式信息流:人工整理,热门,兴趣标签,关注,关系链。 这些都是从用户身上...

2020-02-01 23:55:26 137 0

原创 美团技术年货-算法篇-笔记

pretrain 基于rnn elmo 基于transformer gpt bert downstream-task 分类 序列标注 句间关系判断 阅读理解 nsp 任务对pretrain并没有太大的影响 美团pretrain的优化: 1.混合精度 fp16,fp32 训练加速 2....

2020-02-01 18:28:25 111 0

原创 684. Redundant Connection-冗余连接

原题: In this problem, a tree is an undirected graph that is connected and has no cycles. The given input is a graph that started as a tree with N no...

2020-02-01 12:52:45 52 0

原创 人人都是产品经理

音乐推荐 推荐是基于用户画像,内容画像, 画像是基于标签; 推荐思路是先召回,后排序。召回是基于画像属性,排序是基于多种思路; 涉及到E&E,开发及探索,不能仅仅是推荐同类型的内容,还要探索用户未知的兴趣; 可采用赌博机的bandit的强化学习; 画像类似于知识图谱;可利用知识图谱进...

2020-01-29 19:29:20 1956 0

原创 产品idea

联邦学习:法律行业的智能客服采用此种形式,不使用公共的客服回答体系,使用因企业而异的法律顾问回答体系。

2020-01-28 17:29:58 181 0

原创 中产safe

1.爬虫系统,网站,帖子定向攫取中产维权相关信息,投诉信息 扩充业务线,攫取其他方面信息。 2.toB定向提供给各个新闻报社,自媒体等;

2019-07-28 11:32:06 119 0

原创 阿里技术分享

1.机器人工厂,快速创建机器人,可视化托拉硬拽实现逻辑  逻辑由面向intent,改为面向dialogue; if else then turnIn-function-turnOut 2.robot 测试 robot, 说白了自动脚本,脚本内涵盖机器人可能出问题的各个方面; 系统...

2019-07-28 10:46:43 212 0

原创 机器之心杂文

智能音箱 https://www.jiqizhixin.com/articles/2019-09-30-6 不再补贴硬件 家庭智能大脑入口 无屏,带屏 阿里 aiLab 迅猛扩张,十几人到800人的团队 小度打通百度体系账号 阿里蓝牙模组 清华  极睿科技 https://w...

2019-07-18 08:53:37 129 0

原创 a deep cascade model for multi-document reading comprehension 阅读理解

a deep cascade model for multi-document reading comprehension 1.先排序检索,后精过滤排序 2. 先  document paragraph rank, 再 model-rank 3.model-rank, self-attent...

2019-07-08 10:51:19 241 0

原创 产品软文记录

新型冠状病毒后的办公形式 1.多公司启动远程办公形式,延长在家办公时间; 美团启动无接触配送,无人收餐柜,预先指定地点不见面接收等等。 2.腾讯文档等统一整理出报表,供其他部门泛化使用;云文档,协助不见面统计; 3. 京东养猪 传统形式 传统行业存在诸多需求,全靠人的能力去监控,这...

2019-06-30 23:30:39 40 0

原创 机器之心记录

https://www.jiqizhixin.com/articles/2019-06-17-20 1.营销助手 理念是丰富客户画像,针对的现状是 拜访一个客户,周围潜在客户不清楚不知道 通过用户使用app 信息获取用户资料,结合实际访客交流所获取的信息,补全用户画像。 借100位医生...

2019-06-19 09:54:54 83 0

原创 引导客服,知识付费

机器人库 http://www.jiqirenku.com/rongzi/46727.html 1.智能客服的方向:   售后,导购, 指导说明 2.指导说明的场景:每个服务大厅,广场,都会有服务台,就是给人提供服务的,这些岗位对应都可以用机器人来实现.   还可以给人之路,给人带路,带...

2019-06-09 18:43:37 91 0

原创 0606 人人都是产品经理 阅记

网红带货 http://www.woshipm.com/it/2769162.html 当商品的选择性变多,有意见领袖通过直播的导购,让一部分有选择困难症的消费者降低了选购时间成本,直播具备即时性、刺激性,可以不断刺激消费者抢购、跟风大众的心理。 有业内人士曾经做过一个调查,买网红推荐产品的...

2019-06-06 23:56:32 43 0

原创 分发

看了 http://www.woshipm.com/it/2414392.html 关于信息分发的内容。 思路有所启示: 信息分发 最早是各个阅读里边的 猜你感兴趣,为您推荐。。 今日头条把这个做大,做成一个产品。 类比:聊天机器人在众多业务中只是一个入口,便捷的入口,如果把这个做成一...

2019-06-02 23:58:56 47 0

原创 隐马尔科夫

https://www.jiqizhixin.com/articles/2019-04-19-20 马尔科夫只有 状态转移,状态转移概率,初始状态概率 隐马尔科夫有 状态,状态转移概率,初始状态概率,状态输出概率分布,输出字符集合 hmm常有3个问题:给定一个序列O,求发生概率; 给定一...

2019-04-20 11:18:58 33 0

原创 一团和气不是人和,集体战斗才是--读后总结

http://www.woshipm.com/chuangye/2175534.html 1.因人设岗,因岗招人--根据架构级别的不同而都适用。 想干哪个方向,招负责人,然后负责人根据岗位需求招不同的人。 2.中供铁军--招人招农村经历过苦日子的人。 3个月的魔鬼般的训练,经过了留下的才是自己...

2019-04-06 00:15:50 68 0

原创 产品--中台理解

中台是企业级的概念,是从全局考虑,打破系统孤岛,方便各业务线快速迭代,个性化的需求而制定的新概念。 之前的弊端:系统各自为战,通用性的系统满足不了个性化。针对这个问题而做的。 优势:方便大系统,企业级系统的个性化开发。 提高系统的复用性。 允许个性化开发,即提高了各系统的各业务线的复用的积极性...

2019-04-05 23:20:26 2034 0

原创 知识图谱-关系挖掘

关系挖掘 关系抽取的方法 定义一种关系,根据关系去挖掘所有相关ner 根据挖掘出的三元组的ner,去发现更多的关系 关系抽取的具体方法 关系抽取主要面了准确率不高的问题的克服,噪音太大,即根据一种关系推实体,再根据实体推关系,噪音太大。 解决办法 根据一种关系挖掘的ner,并不...

2019-03-30 23:56:51 858 0

原创 NLP-词的典型性-词的共现

词共现 挖掘词内部的共现信息 细分 1.挖掘 词跟所属概念之间的共现 2.挖掘词跟此之间的共现 统计维度 1.词跟所有所属概念之间的共现频率关系,得出一词多义中的‘义’的分布概率 2. 同一概念下,所有词跟此概念的共现频率统计,得出概念下的代表词 应用 关...

2019-03-30 23:39:13 535 0

提示
确定要删除当前文章?
取消 删除