File Fragment Classifcation Using Neural Networks with Lossless Representations阅读笔记

最新推荐文章于 2021-03-14 21:06:37 发布

忠＆＆信

最新推荐文章于 2021-03-14 21:06:37 发布

阅读量105

点赞数

分类专栏：机器学习文章标签：论文学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42348105/article/details/88171584

版权

机器学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

本文解决了什么问题？

1.将神经网络应用于文件片段分类的新方法，首先，片段的各个位直接用作模型输入，使用这个或任何其他无损特征表示法都没有找到以前的工作。
2.文件片段分类研究的一个主要思想流派是，分类器应该是专门化的，并且应该考虑可能的最具体的模式，以便在准确性和速度方面最大限度地提高性能。这在很大程度上是基于特定应用的需要，过去构造的广义模型的性能不理想。然而，过去的模型都不是真正的可普遍推广的，这可能会对它们的性能产生负面影响，也代表了对其他需要推广模型的应用的未满足需求。

本文运用了什么方法？

资源：GovDocs1语料库
工具：Python3.2 keras theano
1.数据集的提取：不同类型提取相同数量的文件，片段大小为512字节（最小处理单元）
2.特征表示：核心部分
每个片段有512字节，每个字节有8位，每个位有2个特性（1.2），每个片段有819个特性。
3.模型：
前馈：平面格式提供给前馈网络，包括8192个向量
递归：每步一个字节（16个特征），共512步
卷积：512*16矩阵

4.模型调优：手动参数

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。