自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

原创 完全数据驱动的对话模型和社交机器人

研究人员最近开始探索完全数据驱动和端到端(E2E)的会话响应生成方法,例如,在序列到序列(seq2seq)框架内(Hochreiter和Schmidhuber,1997; Sutskever等, 2014)。这些模型完全根据数据进行培训,无需借助任何专业知识,这意味着它们不依赖于第4章中提到的对话系统的四个传统组件。这种端到端模型在社交机器人(chitchat)中特别成功。场景,因为社交机器人很少...

2019-06-19 17:00:58 820

原创 WGAN-GP应用于一维时序信号

前言近年来生成对抗网络在各大顶会上大放异彩,但是大多研究集中在图像方面,衍生出一系列DCGAN、WGAN等等模型,最近我在关于手语识别的研究中使用深度学习效果一般,猜测可能是数据集小的问题,故想到使用GAN来生成手语数据,达到以假乱真的效果。除了这个方面外,GAN在这些信号的生成的研究对于医疗方面受损信号的恢复、意图生成特定的属性的信号方面也具有重要的意义。学习路线(选读)在研究中我走了许多...

2019-06-07 12:26:55 6421 17

原创 字节跳动国际化nlp一面

上来先是两道题,说实话我都见过,但是大致思路记得,做不到bugfree,一个是括号生成,一个是旋转打印矩阵。大约半小时。都写了比较多的代码,但是细节不到位。然后聊项目,生成对抗网络训练的难点,怎么解决的,为什么使用了svm,原理?使用过其他分类方法嘛?对比过缺点吗?svm的应用场景。正则化方法有哪些?还有哪些防止过拟合的方法?这些都答上了。nlp中了解过bert嘛?(简单了解过)bpe和wordpeice是什么?(这个直接说不知道)CNN中的卷积和池化的作用是什么?(CNN的基本知识点)应该是凉了,

2020-06-02 16:12:41 700

原创 京东算法一面面经

京东算法一面面经京东零售推荐技术部:聊了聊基础,lr是什么loss函数推导,做多分类等等,然后讲了transformer和生成对抗网络,还有推荐的架构,算法什么的,(这部分我了解的不多)算法题两个,二分类和快排大约一个小时不到,然后就让我等下他去约二面面试官,不过因为二面面试官在忙,所以等到下次再约。后续在记录。总结:太基础了点··比较简单。...

2020-05-20 16:07:43 429

原创 快手算法一面凉经

快手算法一面凉经上来先问学校,是否能去实习,百度的实习经历。做了一道题,类似编辑距离,不同之处是,插入花费a,删除:b,替换:c。问如何花费最少可以从一个单词变成另一个单词。这个题我按照编辑距离的思路说了出来,但是面试官问,加入abcde变成abcdf,e替换成f的花费要比删除e,在新增一个f的花费还要多,这种情况可以满足吗?然后问了,什么情况可以使用动态规划。然后问了bert,简单讲了一下,打断了问bert的embedding和word2vec的embedding有什么不一样?问self-a

2020-05-19 16:36:24 3008

原创 腾讯TCC nlp算法一面

整个面试过程持续差不多45分钟,但是问的知识点非常广,感觉面了一个半小时········首先自我介绍~针对GAN做数据增强问了问原理,数据怎么去噪的,输入输出分别是什么还有很多细节,有点记不清了seq2seq如何做的,数据清洗怎么做的,为了更好的训练,做了哪些细节?字母大小写转换做了吗?怎么做的?padding技巧怎么做的,loss函数采用的是什么?decoder的输出的参照标准是什么?(这...

2019-11-09 10:58:46 485

原创 百度系统NLP算法一面

下午时候进行百度系统的一面,相对于之前的百度健康部门的面试官,这个面试官更“正常一点”。视频面开始自我介绍。死扣项目点,对于我说的seq2seq模型提出了很多细节问题,比如packing目的是什么,怎么做的,是逐条packing还是整体packing。还有问了我项目中的生成对抗网络和seq2seq模型的本质区别是什么。比较抠细节问题。两个算法题:链表反转(牛客原题)链表前k个节点反转,...

2019-11-08 22:37:12 310

原创 百度算法岗(全都是开发)一面二面面经

刚刚面试了百度医疗健康部门的日常实习算法岗,面经如下:一面(一个小时20分钟)一个小姐姐,上来先自我介绍。贪心算法介绍算法题1:最大和子数列,牛客原题,但要求用贪心和动态规划求解动态规划算法介绍python异常处理怎么做? try expect elsepython数据类型有哪些 八种列表和元祖的区别python内存管理机制介绍python如何用一条语句去除列表中的空...

2019-11-06 22:22:01 1554

原创 leetcode刷题笔记

1103.Distribute Candies to People

2019-07-27 10:35:07 107

原创 Python中的Flags&tensorflow中的flags使用

最近在看bert的源码,一上来就是各种flags,本菜鸡以前没怎么接触过,所以特此学习记录。flags的作用flags可以通过命令行动态的更改代码中的参数使用方法from absl import flagsfrom absl import appFLAGS = flags.FLAGSflags.DEFINE_string('model', None, 'model to run'...

2019-07-09 17:41:56 963

原创 业界AI对话

这部分描述了工业中对话系统的前景,包括面向任务的系统(个人助理)、QA系统和闲聊型机器人。6.1QA系统包括谷歌,微软和百度在内的搜索引擎公司已将多轮QA功能纳入其搜索引擎,以使用户体验更具对话性,这对移动设备尤其具有吸引力。由于这些系统内部(例如Google和百度)的公开知之甚少,本节介绍了一些示例商业QA系统,其架构少部分在公共资源中描述,包括Bing QA,Satori QA和客户支持代...

2019-06-20 14:26:35 258

原创 任务导向的对话系统

第四章概述首先概述了面向任务的对话系统的基本概念,术语和典型架构。其次,它回顾了对话系统评估的代表性方法。这部分与用于构建这些系统的具体技术大致正交。接下来的三个部分重点关注典型对话系统中的三个主要组成部分,重点是近期的神经方法。最后,我们回顾了最近关于端到端对话系统的几项工作,这些工作是由深度学习和强化学习的最新进展所促成的,最后一节提供了进一步的讨论和指示。插槽填充对话...

2019-06-18 10:58:09 1445

原创 聊天机器人综述推理部分

3.7.2 推理推理方式根据不同类别分为单步模型(Single-Step Reasoning)和多步模型(Multi-Step Reasoning)单步模型只将问题和文档内容匹配一次并生成答案。左边是随机答案网络,右边是BiDirectional Attention Flow model我们现在从Memory中找出答案范围,首先,总的问题矢量为:hq=∑iβihiq\mathbf{h...

2019-06-12 17:03:30 436

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除