复旦NLP--文本相似度算法

最新推荐文章于 2020-09-24 14:08:59 发布

VIP文章策邪恶

最新推荐文章于 2020-09-24 14:08:59 发布

阅读量3.8k

点赞数 1

分类专栏：自然语言处理文章标签：自然语言处理文本相似度复旦NLP 机器学习新闻相似度

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cecesjtu/article/details/38385745

版权

开场白

大作业进了自然语言处理的坑，真是毁一生。作业涉及到文本相似度的比较，所以就打算用复旦的这个NLP包，之所以不用哈工大的那个，是因为复旦是友校嘛╮(╯-╰)╭

先讲讲我们作业的应用场景吧，就是根据一个新闻找到他的相关新闻，看上去很简单，甚至直接百度就可以做到。但是后来发现结果并不是很令人满意，于是我们打算基于百度到的结果再对新闻的相关度进行比对。

算法实现

复旦NLP是可以进行机器学习，训练，然后进行相似度的计算的。人家专门有个包是做这个的，但是我们这项目，本身期望不高，就没这么麻烦，于是乎就没有看这个包里面的东西，那除了训练以外，复旦NLP也提供有不需要训练直接计算的接口，那精度跟训练的比较起来如何我也就不知道了，反正能用就好╮(╯-╰)╭

那不训练的算法其实也是看上去很科学的~首先针对两个文本a，b；第一步是调用相关的parser生成两个DependencyTree，至于这个

最低0.47元/天解锁文章

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复旦NLP--文本相似度算法

开场白
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。