目录
数据分析 是一个探索性的过程,通常从特定的问题开始。它需要好奇心、寻找答案的欲望和很好的韧性,因为这些答案并不总是容易得到的。
数据可视化 ,即数据的可视化展示。有效的可视化可显著减少受众处理信息和获取有价值见解所需的时间。
数据分析和数据可视化这两个术语密不可分。在实际处理数据时,数据分析先于可视化输出,而可视化分析又是呈现有效分析结果的一种好方法。
1.等高线
实验背景
现有一份山东大学软件学院的卫星三维坐标高程数据,存储在CSV文件中。请编写python程序实现山东大学软件学院的卫星图的可视化,并绘制出等高线图。
推荐第三方库:
读取CSV库:csv、pandas
数据处理库:numpy、pandas
绘制图像库:matplotlib
实验步骤
-
用python脚本导入CSV文件数据,获取保存x,y,z轴数据
-
用np.meshgrid(x,y)生成二维网格,可以理解为三维图像的x,y平面;用griddata(ground, zList, (X, Y), method='cubic')生成与二维网格有映射关系的高度2D数组
-
最后使用plt.contour(X,Y,Z)绘制图像
绘制结果
2.词云(选做)
实验背景
现有一份CPU商品的数据表格,包含了CPU名称、基本参数、详细参数、价格、评论等信息。现要求从该表格中提取CPU的评论信息,数据处理后生成评论的关键字,并将关键字展示在词云上。
推荐第三方库:
import jieba # python分词库,用于提取文本关键词 import pandas as pd # 用于处理表格数据 from wordcloud import WordCloud # python词云库,用于生成关键字词云
实验步骤
-
使用pandas库读取表格数据,获取评论信息
-
使用jieba库,将评论文本进行分词,获取关键字.分词过程中可以使用停用词来提高关键字的质量.
-
使用WordCloud库生成词云图片,将图片保存在本地
绘制结果