这篇博文是为了分享一个标题党鉴别的实践[1].
这是一个融合的网络结构, 有语义信息, 有文章各元素的数字特征. 准确率达到了0.99诶.
- 语义信息
title 和 正文的 embedding. - 文章元素的数字特征
- 文章长度
- 主标题长度
- 副标题长度
- 段落个数
- 文中图片个数
图 文章中的网络结构图
参考
- linked-in article, clickbaits-revisited-deep-learning-title-content-features-thakur
这篇博文是为了分享一个标题党鉴别的实践[1].
这是一个融合的网络结构, 有语义信息, 有文章各元素的数字特征. 准确率达到了0.99诶.
图 文章中的网络结构图