数据驱动安全(DATA-DRIVENSECURITY)学习--第二章
原版:《Data-Driven Security:Analysis,Visualization and Dashboards》
译版:《数据驱动安全:数据安全分析、可视化和仪表盘》
Jay Jacobs、Bob Rudis[著] 薛杰、王占一、张卓[等译]
ISBN:987-7-111-51267-7
伟大的事业是通过不懈努力,一砖一瓦建立起来的。 --------Hesiod
0x01 语言的使用
本书中推荐使用的是python2.7+Canopy和R(版本小于3.0,最好2.15)+Rstudio
python 实例:
import numpy as np
import pandas as pd
np.random.seed(1492)
test_df = pd.DataFrame({"var1":np.random.randn(5000)})
test_df.hist()
python 结果:
R 实例:
> library(ggplot2)
> set.seed(1492)
> test.df = data.frame(var1 = rnorm(5000))
> ggplot(data= test.df) + geom_histogram(aes(x = var1))
R 结果:
0x02 数据帧介绍
R和Python提供了标准的数据类型集合,他们有一个共同的数据类型:数据帧。从表面上看,数据帧仅仅是表现表格数据(标准的Execl电子表格中展示的数据类型)的一种方法,并且看上去很像是二维数组。然而,如果深入剖析,就会发现数据帧是数据库表、矩阵、二维数组以及具有许多额外的省时特性的数据透视表的一体化组合。
像数据库表,每列在数据帧中有一个列名并拥有相同类型的数据元素,可以在全列、全行以及各列/行子集中执行操作。增加、合并、扁平、扩展、修改、删除以及查找等针对数据的操作在R 和Python中都只需要一行代码。
0x03 小结
本章节主要介绍了R和Python,比较简单,此外还介绍了批处理创建项目工程的方法,关于批处理的操作,后续单独出一个总结。