数据可视化的概念
- 将数据转化为图形,描述数据的分布、数值和比例
- 数据从收集到展示的过程,生成可以让人理解的,具有可读性的展示方法
- 使用统计图形,图表,信息图表和其他工具,用点、线或条对数字数据进行编码,以便在视觉上传达定量信息
- 可以帮助客户分析和推理数据和证据,各种类的图表用于显示一个或多个变量的数据中的模式或关系
可视化数据的三个要素
- 可读性,数据可视化的基本要求,可视化后的数据可以被阅读者理解
- 明确性,可视化结果可以反应数据的真实情况
- 平衡性,信息显示的数量与输出结果美观度之间的平衡
可视化方式的选择/数据的展示
- 表格
- 数据归总后按照不同维度输出的展示样式
- 表格输出的内容一定是归总抽象后的数据
- 图形
- 将数据的值使用图形进行定量化直观地输出
- 基本原则是越大的数字,所占图形的比例就越高
+ 柱状图 反应数量
+ 折线图 描述趋势
+ 饼图 展示比例
+ 瀑布图、蜘蛛图等用于描述更加复杂的信息
- 清单
- 将数据集中的记录一条一条列出来,不需要对数据进行任何处理
- 需要选择相匹配的重要变量和部分变量的合并,清单可以更直观的反应数据
- 清单内是没有经过归总的数据,仅仅将数据列出来而不做过多的数据分析工作
ODS系统(output deliver system)
- 在结果统计分析完成后,将统计结果输出为其他格式,通过ODS
- SAS中用于proc生成的结果输出为其他格式,然后通过ODS生成多种多样的文件格式
- RTF/PDF/HTML/PCL
- 输出被SAS接受的listing(默认情况)和output
基本语法
ods 输出格式 输出文件 style= ;
proc .....
ods 输出格式 close;
ods rtf file='C:\Users\apple\Desktop\print.rtf';
proc print data=sashelp.cars;
run;
ods rtf close;
ods output 语句
基本语法
ods output proc 结果名(proc自带的输出结果,系统定义)=输出数据集名(自定义数据集名称);
ods output summary=s;
proc means data=sashelp.cars;
var mpg_city;
class type;
output out=p;(p的数据集格式与结果栏现实并不相同,将二维转化为一维)
run;
ods output close;
- ods output 可以尽可能保证输出数据集与显示结果的对应
- output语句输出的数据集是根据proc不同,会转化为系统认可的结果
ods trace on 语句
ods trace on; 将结果名显示出来
proc means data=sashelp.cars;
var mpg_city;
class type;
run;
一次性生成多个数据集
ods output parameterestimates=param residualplot=res;
proc reg data=sashelp.baseball;
model salary= cratbat crhits crhome crruns crrbi;
run;quit;
ods output close;
生成数据报表(proc report)
- 一般可以使用proc report、proc tabulate、proc print等
proc report 基本知识点
- 将数据集的结果输出到结果栏,参数也是围绕着调整输出结果的样式而设计
- 可以有大量自定义的显示样式、分隔符等,帮助我们更加随意地定义表格样式
- 基础语句
proc report data = datasets;
column/columms variables;(用于指定需要在结果中输出的变量)
run;
proc report data=sashelp.cars;
column make model type msrp enginesize horsepower;
where msrp<11000;
run;
define 变量名/相关参数;
proc report data=sashelp.cars;
column make model type msrp enginesize horsepower;
define make/group;(将变量名进行了分组的