- 博客(4)
- 收藏
- 关注
原创 一种基于CNN的自动化提取n-gram feanture的文本分类模型
今天写的博客主要参考了清华大学黄民烈老师团队2018年在IJCAI上发表的paper《Densely Connected CNN with Multi-scale Feature Attention for Text Classification》。 这篇paper其实就是使用基于CNN的网络来进行文本的情感分类,但是它针对的问题是传统的多层次的CNN网络使用static窗口来进行卷积,每次针对...
2018-08-19 22:10:39 3596
原创 引入情感信息的chatbot
今天讲的内容主要参考了清华大学黄民烈老师团队在2018年在AAAI会议上发表的paper《Emotional Chatting Machine: Emotional Conversation Generation with Internal and External Memo》。这篇paper针对的场景是聊天机器人,使用的基本模型也是encoder-decoder架构。但是不同的是在聊天机器人...
2018-08-19 20:59:37 724
原创 利用用户搜索词生成商品标题信息——阿里巴巴IDST
今天介绍的论文是阿里IDST在2018年AAAI上发表的paper《A Multi-task Learning Approach for Improving Product Title Compression with User Search Log Data》。 其应用背景是,现在越来越多的用户开始习惯于使用手机、PAD等移动端进行网购行为,而这些移动端产品相比于传统的PC端来讲,其屏幕尺寸更...
2018-08-05 22:35:40 2537
原创 关于teacher-student(知识蒸馏)的一些思考与总结
最近看了两篇有关teacher-student架构的paper,感觉收获挺大的,今天就来总结一下。这个teacher-student模式架构主要的目的就是用来进行模型的压缩,属于model compression领域中的一种比较流行的做法。因为深度学习下为了能够获得更好的准确率,训练出的网络往往结构比价复杂,而对于一些在线预测任务来说,复杂的模型结构不利于线上预测任务的快速响应需求。故在该模型框架...
2018-08-05 18:35:38 32937
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人