访存模式分析实验思路(毕设笔记9)

本文是作者进行访存模式分析实验的思路笔记,主要涉及无监督学习中的聚类方法,如kmeans、凝聚聚类、层次聚类和DBSCAN。由于实验数据为时间序列的程序访存行为,作者计划结合时间序列分析,特别是Dynamic Time Warping (DTW)和1 nearest neighbor (1NN),以聚类和LSTM模型来学习内存访问模式。在聚类基础上,利用LSTM进行训练和验证,但可能面临大量LSTM模型的训练问题。
摘要由CSDN通过智能技术生成

访存模式分析实验思路(毕设笔记9)

因为作者只是个刚刚修读过人工智能基础的入门菜鸡,然后这次要做的是针对访存数据进行无监督学习。数据大概长这个样子:

0x7f1eae6dc103:W 0x7fff31765108(from Pin)
指令地址,访存方式,存储地址

0x7faf78ee1103,w,8,0x7ffd865120c8(from DynamoRIO)
指令地址,访存方式,数据大小,存储地址

首先是需要了解一下聚类的常见方式和实现,参考了这篇https://cncws.github.io/introduction-to-ml-with-python/unsupervised-learning-and-preprocessing/https://cncws.github.io/introduction-to-ml-with-python/clustering/,两篇博客都从宏观上介绍了流行的聚类方法,后者包括了使用sckit-learn进行简单实现的代码说明。

从阅读的结果来说,聚类主要方式有:kmeans,凝聚聚类,层次聚类和DBSCAN等,然后kmeans对数据成簇的形状要求比较高,它要求所成簇基本上是凸的,如果不满足这一要求,聚类的结果可能会不理想。

然后就是相同作者写下的这篇https://cncws.github.io/introduction-to-ml-with-python/dimensionality-reduction-feature-extraction-and-manifold-learning/https://cncws.github.io/introduction-to-ml-with-python/preprocess-and-scaling/</

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值