个人资料
sladesha
https://github.com/sladesha
展开
-
快速上手关键词抽取的算法
前言在自然语言处理领域,我们有一种类型的问题是如何在一堆文本中提取出核心词/句子。而无论是对于长文本还是短文本,往往几个关键词就可以代表整个文本的主题思想。同时,在很多推荐系统中,由于无法直接就整体文本进行利用,往往会现对文本进行汇总,常用的方法就是embedding或者关键词抽取,关键词提取的准确程度直接关系到推荐系统或者搜索系统的最终效果。让我们看下有哪些快速上手可用的方法。TFIDFT...原创 2020-01-04 20:40:18 · 568 阅读 · 0 评论 -
Bert需要理解的一些内容
更多来自于GitHub:Reflection_Summary.Bert的双向体现在什么地方?mask+attention,mask的word结合全部其他encoder word的信息Bert的是怎样实现mask构造的?MLM:将完整句子中的部分字mask,预测该mask词NSP:为每个训练前的例子选择句子 A 和 B 时,50% 的情况下 B 是真的在 A 后面的下一个句子, 50% ...原创 2019-12-20 15:17:47 · 1877 阅读 · 0 评论 -
xDeepFM架构理解及实现
本文主要是为了讲解xDeepFM的框架,及如何用tensorflow去实现主干部分,如果需要直接拆箱可用,可以参考:xDeepFM,我的部分代码也来自于其中,这边主要是和大家一起对比着看下,xDeepFM到底做了哪些事情?我的工程实现代码等待我司项目上线稳定后开源。XDeepFM到底extreme在哪里?首先,我在做论坛帖子推荐的时候遇到这么一个问题(问题真实,问题内容纯属虚构),用户A:带有...原创 2019-12-17 21:00:24 · 1321 阅读 · 0 评论 -
Auto-Machine-Learning初探
前言最近在看AutoML,业界在 automl 上的进展还是很不错的,个人比较看好这个方向,所以做了一些了解:Google: Cloud AutoML, Google’s Prediction APIMicrosoft: Custom Vision, Azure Machine LearningAmazon: Amazon Machine LearningBaiDu:EasyEAli...原创 2019-12-07 15:10:37 · 609 阅读 · 0 评论 -
集成学习需要理解的一些内容
本系列为深入篇,尽可能完善专题知识,并不会所有的都会出现在面试中,更多内容,详见:Reflection_Summary,欢迎交流。另外,欢迎大家关注我的个人bolg,知乎,更多代码内容欢迎follow我的个人Github,如果有任何算法、代码疑问都欢迎通过邮箱发消息给我。介绍一下Boosting的思想?初始化训练一个弱学习器,初始化下的各条样本的权重一致根据上一个弱学习器的结果,调整权...原创 2019-12-06 17:37:42 · 511 阅读 · 0 评论 -
LR需要理解的一些内容
本系列为深入篇,尽可能完善专题知识,并不会所有的都会出现在面试中,更多内容,详见:Reflection_Summary,欢迎交流。另外,欢迎大家关注我的个人bolg,知乎,更多代码内容欢迎follow我的个人Github,如果有任何算法、代码疑问都欢迎通过邮箱发消息给我。logistic分布函数和密度函数,手绘大概的图像分布函数:密度函数:其中,μ表示位置参数,γ为形状参数。logi...原创 2019-12-06 17:32:14 · 1983 阅读 · 0 评论 -
DynamicProgramming动态规划整理
整理一下刷题过程中的一些想法,方便以后高效复习,动态规划部分整理如下:主要的思路有如下几种:基础类型只需要写出i和i-1之间的状态转移方程即可,没有任何额外操作的行为,比如:一维度:53. 最大子序和,状态方程是:dp[i] = max(dp[i-1]+nums[i],nums[i])70. 爬楼梯,状态方程是:result[i]=result[i-1]+result[i-2]...原创 2019-09-05 17:12:03 · 195 阅读 · 0 评论