开心!!今天白天没有课类,现在0755,开始学习啦!!!
上午打算看一下APT论文,准备一下晚上的pre~
一、APT
(一)TTPDrill(预计30min)
1、先把昨天的问题copy过来
1、本体构建过程?如何进行semi-automatically
2、如何进行threat actions和ontology之间的map
3、weighing and flitering的dictionaries是做什么的?
4、提取中,nlp part的rule是什么?哪里使用了IR?
2、本体构建过程
(1)ATT&CK
主要集中于tactic(14)和techniques(190+)的总结
(2)CAPEC(Common Attack Pattern Enumeration and Classification)
更加关注攻击模式
(3)确认过眼神,纯手工人脑打造
3、mapping 过程
4、dictionary的作用
5、nlp的rules是什么
6、mapping之后呢?有什么用?
构建标准语言
7、如何设置threshold呢?
chap6.1
8、总结
- 这篇文章解决了将攻击从自然语言变为结构化的问题——从CTI报告中自动提取action,对应ontology生成,STIX格式的信息、其中,提取运用nlp;ontology是基于ATT&CK和CAPEC;STIX格式生成我没看。
- 问题在于:1、完了之后呢?提取后的STIX如何被应用?2、提前定义的ontology是否能与时俱进,有没有更新手段?3、threshold的设置是否合理
----0856休息一下~
(二)Recent Progress of Using Knowledge Graph for Cybersecurity
1、目标&时间
时间:40min
(1)弄清kg是什么
(2)在cs有什么应用
2、RDF和OWL
知乎有一篇相关的、之前收藏过的文章,今天没事的时候看一下
(1)RDF-resource description framework
三元组,用来描述实体与实体之间的关系——(实体,谓词,实体)
3、NER
NER是命名实体识别的英文缩写(Named Entity Recognition)。所谓Named Entity是一类具有相似属性的项,一般形式为词或短语,如人名,地名,机构名等。NER是对文本中的命名实体定位,并分到预定义的实体类别的过程
4、综述前半部分挺好的,后半部分看不下去了emm。看下一篇叭~
(1)Distributed representation
原来就是词向量哦~
太牛了,我哭了,他好棒distributed representation和distributional representation的区别
‘’这种分散式表示”只要在低维的空间中能够区分出两个词的不同就够了。不一定非得要求意义相近的词距离也相近。因为上层的神经网络可以具有高度非线性,完全可以将原始的表示空间高度扭曲”——邱邱
distributed是一种低维度的表示方法,只要去分开不同的词就够了;
ditributional是一种获得语义信息的方法,假设上下文相同的词语含义相同。
(2)NER中的decoder
对编码,进行解码,分到相应的类别中去
--------1103脑子转不动啦~去打饭!!
n、问题
(1)关系提取
(2)知识图谱和传统的图有什么区别
(3)security awareness和security assessment有什么区别?
------1452洗完澡,看了一会文献,感觉心静不下来。把上午的内容草草过完,剩下的应用和future部分明天看吧!!!
二、Pre准备
现在准备一下下午的presentation
1、 Semantic Role Labeling (SRL)
以句子谓词为中心,研究其他元素与其关系
三、美亚2021集体赛
啦啦啦
pre完啦~
emm尴尬的是,解压要好久呀~所以还是看看上午的综述叭
emm
四、安全论文
解决一下昨天的问题叭~没找到emmm
五、做lab1叭
敲代码开心一会~
(一)avg_cluster_coef
measures how connected v’s neighboring nodes are
(二)pagerank更新公式的理解
1/N理解为随机过来的叭,那么重要性和大家一样啦,就是1/N
不开心就去写代码吧然后就开心啦
今天至少还看了clustering_coeffiecient&PageRank