unit 6 常用库的使用 习题
2020/6/14 unit6
题目:
-
读取外部csv格式的数据文件GDP.csv, 去掉存在缺失数据的那些行,再把剩 余的数据以csv格式存储到相同的文件夹中的GDP_new.csv文件中。
-
读取外部csv格式的数据文件GDP_new.csv,以Year为自变量,CPI为因变量 画图,线设置为实线,点为实心点,颜色设置为绿色,在纵坐标y=1处画水平 线。添加坐标轴标签,横坐标标签为“Year”,纵坐标标签为“CPI”,图形 标题为“Figure ”,并利用legend添加图例介绍。
-
读取外部csv格式的数据文件GDP_new.csv,提取前30行数据,以Kapital为 自变量,GDP为因变量,画散点图,散点大小设置为15,形状设置为“*”,颜 色设置为红色。添加坐标轴标签,横坐标标签为“Kapital”,纵坐标标签为 “GDP”,图形标题为“The scatter figure of GDP and Kapital”,横坐标范围设置 为02000,纵坐标范围设置为08000。
-
读取外部csv格式的数据文件GDP_new.csv,提取CPI,绘制带有凹槽的箱形 图,显示均值并且用线表示,箱体垂直摆放,内部颜色设置为黄色边框为绿 色,图形大小设置为宽4高6,箱子下面标签为“CPI”,整个图形的标题设为 “The boxplot of CPI”。
-
读取外部csv格式的数据文件GDP_new.csv,提取KR,分别绘制KR的频数分 布直方图(bar的个数为6,颜色设置为绿色,X轴标签为“KR”,图形标签为 “frequency”)、频率分布直方图(bar的个数为6,颜色设置为红色,X轴标签 为“KR”,图形标签为“PDF”)和累计分布直方图(bar的个数为6,颜色设置为 粉色,X轴标签为“KR”,图形标签为“CDF”).
-
已知某班同学的身高数据,分布在150-160,160-170,170-180和180学生人数 分别为5,28,35,4,绘制有阴影的饼图,每一块离开中心距离分别为0, 0.1, 0, 0.1, 颜色分别设置为黄色、绿色、蓝色和粉色,每一块饼图外侧显示的标签分别为 “150-160,160-170,170-180,180”,饼图半径设置为0.8,从y轴正方向顺时针绘制, 饼图内百分比设置为小数点之后两位。
代码:
1
import os
os.getcwd()
os.chdir('/Users/janine/documents')
import pandas as pd
# pd.read_csv("GDP.csv")
data0 = pd.read_csv("GDP.csv")
data = data0.dropna()
# 剩余的数据以csv格式存储到相同的文件夹中的GDP_new.csv
d