单层lstm的伪孪生网络计算句子的相似度

eunicechen

于 2018-08-01 18:04:38 发布

阅读量3.6k

点赞数

分类专栏：机器学习 NLP 文章标签： NLP Deep learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/eunicechen/article/details/81335415

版权

机器学习同时被 2 个专栏收录

17 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

基础版本实验：选用final hidden states, [h1, h2, |h1-h2|, h1.*h2]，以1：2构造正负例，参考dssm(原文是1：4)

single lstm 孪生网络

数据是4w的pair对

训练曲线如下图：

最终任务测试集上的准确率（和本任务中dssm的准确率做对比），如下图所示：

本任务lstm singe (正：负 = 1：2)	本任务lstm singe (正：负 = 1：4)	本任务lstm singe (正：负 = 1：10)	本任务lstm singe (正：负 = 1：30)	本任务Dssm(正：负 = 1：4)
top1ACC:0.811159	top1ACC:0.832618	top1ACC:0.793991	top1ACC:0.611588	top1ACC:0.802575

另外我们在本任务中的另一个测试集上也做了对比：

本任务lstm singe (正：负 = 1：4)	本任务Dssm(正：负 = 1：4)
top1ACC:0.629000	top1ACC:0.617667

结论：

1. Dssm正负例比例1：4应该是多次实验的结果，正负例比例过于不均衡，会减弱准确率；

说明：

1. 本任采用测试集均为项目中的真实数据标注测试集，具有实际说明效应。

改进计划:

模型为初始版本，仍然还在改进中：

1. loss function: margin loss

~~2. 负例构造~~

3. lstm结构

4. NN层

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

eunicechen CSDN认证博客专家 CSDN认证企业博客

码龄16年

18: 原创

27万+: 周排名

206万+: 总排名

7万+: 访问

: 等级

840: 积分

3: 粉丝

9: 获赞

8: 评论

29: 收藏

私信

关注

热门文章

分类专栏

笔记
机器学习 17篇
library 4篇
NLP 4篇
深度学习 4篇

最新评论

单层lstm的伪孪生网络计算句子的相似度
wenhuiliu701: 大佬可以分享一下伪孪生的代码嘛，万分感激！
Tensorboard estimator export_savedmodel简单用法
233彭于晏: 找到原因了[code=python] estimator.export_savedmodel(export_dir, serving_input_fn(), assets_extra={"vocab.txt": FLAGS.vocab_file}, as_text=False, strip_default_attrs=True) ## 把serving_input_fn()括号去掉 [/code]
Tensorboard estimator export_savedmodel简单用法
233彭于晏: 请教下这个是什么原因呀，大佬
Tensorboard estimator export_savedmodel简单用法
233彭于晏: [code=python] TypeErrorTraceback (most recent call last) <ipython-input-34-5c2d99dad76c> in <module>() 14 15 export_dir = os.path.join("./", "saved_model") ---> 16 estimator.export_savedmodel(export_dir, serving_input_fn(),as_text=False,strip_default_attrs=True) /opt/anaconda2/lib/python2.7/site-packages/tensorflow/python/estimator/estimator.pyc in export_savedmodel(self, export_dir_base, serving_input_receiver_fn, assets_extra, as_text, checkpoint_path, strip_default_attrs) 583 self._create_and_assert_global_step(g) 584 random_seed.set_random_seed(self._config.tf_random_seed) --> 585 serving_input_receiver = serving_input_receiver_fn() 586 587 # Call the model_fn and collect the export_outputs. TypeError: 'InputFnOps' object is not callable [/code]
LibSVM3.21使用笔记----for python3.4 配置
七百攻的卉卉酱: 请问一下输入 from svmutil import *的时候，老是出错是咋回事呢 Traceback (most recent call last): File "<pyshell#4>", line 1, in <module> from svmutil.py import * ModuleNotFoundError: No module named 'svmutil'

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。