说在前面:
大三上学期期末由于疫情,被逼得一天准备一科都行,而这学期大三下期只有两科,考前都没准备好。最主要的原因就是大数据分析技术题库太难,而且考试也不全是题库上的,印象很深的就是找“张姓”同学个数和成绩等这个大题15分,平时练了,但是题库上没有。
另外,题库上有些题目也有点问题。为了以后学弟学妹能轻松点,同时为了避免侵权,也为了能给学弟学妹们一点空间练习,仅把我自己原创以及确定的答案和发现的问题发出来。
参考代码中遇到要打开文件的情况,就将代码和文件放到一起,这样不需要完整的路径也可以执行了。文件有的数据不完整,就只是看到本题或者其他题目的图片,简单创建了一个文件测试执行结果。如果发现有问题,欢迎指出,我予以改正!真羡慕你们有这么好的学姐。
1.
(1)p = data.cumsum()/data.sum()
(2)p.plot(color = ‘r’, secondary_y = True, style = ‘–o’,linewidth = 1)
(3)plt.annotate(format(p[6], ‘.4%’), xy = (6, p[6]), xytext=(60.9, p[6]0.9),
(4)arrowprops=dict(arrowstyle="->", connectionstyle=“arc3,rad=.5”))
下列说法错误的是(D)
A.(1)中cumsum是累计上和
B.(2)secondary_y = True表示连个纵坐标
C.(3)中format(p[6], ‘.4%’)小数点后面取4位
D.(2)中style = ‘–o’表示画实线
2.
from future import print_function
import pandas as pd
catering_sale = ‘…/data/catering_sale_all.xls’ #餐饮数据,含有其他属性
data = pd.read_excel(catering_sale, index_col = u’日期’)
x=data.corr()
print(x)
的输出是(D)
A.数据中的日期值 B.数据按日期排序的值
C.与日期有关的相关系数 D.相关系数矩阵
参考代码:
from future</