-
选择题
1 .在Jupyter notebook的cell中安装包语句正确的是(C)
A . pip install 包名 B . conda install 包名 C . !pip install 包名 D . !conda install 包名
2 .字符串是一个字符序列,例如:字符串s,从右侧向左第3个字符用什么索引?(B)
A . s[3] B . s[-3] C . s[0:3] D . s[:-3]
3 .利用下面哪个可视化绘图可以发现数据的异常点(C)
A . 密度图 B . 直方图 C . 盒图 D . 概率图
4 .以下( )函数可以在绘制图表时,设置x轴的名称(C)
A . xlim() B . ylim() C . xlabel() D . xticks()
5 .Matplotlib中哪个包提供了一批操作和绘图函数?(A)
A . pyplot B . Bar C . rcparams D . pprint
解析:pyplot : Matplotlib的子库,提供了和MATLAB类似的绘图API。
6 .Jupyter notebook不具备的功能是 ( D )
A . Jupyter notebook可以直接生成一份交互式文档
B . Jupyter notebook可以安装Python库
C . Jupyter notebook可以导出HTML文件
D . Jupyter notebook可以将文件分享给他人
7 .Numpy中统计数组元素个数的方法是 ( C )
A . ndim B . shape C . size D . itemsize
8 .在Jupyter notebook的命令模式下,查看所有快捷键应该按下的键是 (C )。
A . M B . ESC C . H D . A
9 .以下关于绘图标准流程说法错误的是(B )
A . 绘制简单的图形可以使用缺省的画布
B . 添加图例可以在绘制图形之前
C . 添加x轴,y轴的标签可以在绘制图形之前
D . 修改x轴标签,y轴标签和绘制的图形没有先后
10 .以下说法错误的是(C )
A . 饼图一般用于表示不同分类的占比情况。
B . 箱线图展示了分位数的位置。
C . 散点图无法反映特征间的统计关系。
D . 词云对于文本中出现频率较高的关键词予以视觉上的突出。
11 .下面不属于python特性的是(C )
A . 简单易学 B . 免费开源 C . 属于低级语言 D . 高可移植性
12 .以下说法错误的是( C)
A . 饼图一般用于表示不同分类的占比情况。
B . 箱线图展示了分位数的位置。
C . 散点图无法反映特征间的统计关系。
D . 词云对于文本中出现频率较高的关键词予以视觉上的突出。
13 .下列参数中调整后显示中文的是( C)
A . lines.linestyle B . lines.linewidth C . font.sans-serif D . axes.unicode_minus
14 .下列选项中不能创建Numpy数组的选项是(B )
A . a = numpy.array([1,2,3]) B . a = numpy.array([1,[1,2,3],3])
C . a = numpy.array([[1,2,3],[4,5,6]])
D . a = numpy.array([[‘xiao’,’qian’],[‘xiao’,’feng’]])
15 .Numpy提供了两种基本对象,一种是ndarray,另一种是(B )
A . array B . func C . matrix D . Series
16 .下列参数中调整后显示中文的(C )
A . lines.linestyle B . lines.linewidth C . font.sans-serif D . axes.unicode_minus
17 .创建画布需要使用(A )函数。
A . figure( ) B . add_subplot( ) C . Figure( ) D . Add_subplot( )
18 .下列说法正确的是(D )
A . count函数用于数据中的所有数据
B . 统计时使用descript函数,最后结果不会出现min项
C . diff表示三阶差分
D . var函数用作方差统计
19 .Numpy.random模块中用于对一个序列进行随机排序的函数是(B )
A . uniform B . shuffle C . permutation D . normal
20 .以下关于缺失值检测的说法中,正确的是(D )
A . null和notnull可以对缺失值进行处理
B . dropna方法既可以删除观测记录,还可以删除特征
C . fillna方法中用来替换缺失值的值只能是数据框
D . Pandas库中的interpolate模块包含了多种插值方法
21 .在Jupyter notebook中按(B )键进入命令模式。
A . 回车键 B . ESC C . Ctrl+enter D . A
22 .设置索引使用哪种方法。(D )
A . merge()方法 B . concat()方法 C . to_datetime()方法 D . set_index()方法
23 .在以下Pandas方法中不能实现实现合并数据的函数是( A)。
A . agg()函数 B . concat()函数 C . join()方法 D . merge()函数
24 .下列说法不正确的是( B)。
A . union用于计算索引的交集
B . isin用于数据是否包含在其中
C . insert函数可以插入索引
D . unique用于计算索引中的唯一数组
25 .在绘制图形是需要使用( A)对x轴数据范围进行限制 。
A . xlim( ) B . xticke( ) C . legend( ) D . show( )
26 .以下哪条语句定义了一个Python字典。( A)
A . {} B . {1,2} C . [1,2] D . (1,2 )
27 .下列说法正确的是( A)。
A . Series对象的结构比DataFrame对象的结构简单
B . DataFrame可以看成Series的子集
C . sort_index用作索引重建
D . HDF4格式文件可以与HDF5文件兼容
28 .在NumPy中创建一个元素均为0的数组可以使用(A )函数。
A . zeros( ) B . arange( ) C . linspace( ) D . logspace( )
30 .Numpy中的diag函数用于创建(A )。
A . 对角矩阵 B . 三角矩阵 C . 值为1的矩阵 D . 值为0的矩阵
31 .循环结构可以使用Python语言中的( B)语句实现。
A . print B . while C . loop D . if
32 .使用( A)函数可以将配置文件重置。
A . rcdefault( ) B . matplotlib_fname( ) C . get_configdir( ) D . rc_params( )
33 .下列选项中不是矩阵选项的是(D )
A . A B . I C . H D . B
34 .进行数据的占比比较时使用C )表示。
A . 散点图 B . 直方图 C . 饼状图 D . 折线图
35 .以下哪个函数可以实现画布的创建?(C )
A . subplots( ) B . add_subplot( ) C . figure( ) D . subplot2grid( )
36 .创建一个3*3的数组,下列代码中错误的是( C)。
A . np.arange(0,9).reshape(3,3) B . np.eye(3)
C . np.random.random([3,3,3]) D . np.mat(“ 1,2,3;4,5,6;7,8,9”)
37 .Python中定义函数的关键字是(A )。
A . def B . define C . function D . defunc
38 .分析股票你选择用哪种分析方法(C )
A . 聚类 B . 一元线性回归 C . 时间序列 D . 多元线性回归
39 .下列代码运行的结果是( B)
a = numpy.array([1,2,3])
b = numpy.array([4,5,6])
a+b
A . [1,2,3,4,5,6] B . [5,7,9] C . 21 D . 12
-
填空题
1 .CSV文件也称为字符分隔值文件,默认情况下以_逗号_进行分隔。
2 .Python中要使字符串转义字符不转义,则直接在字符串前加字符__r__。
3 .创建一个范围在(0,1)之间的长度为12的等差数列的语句是_np.linspace(0,1,12)_.
4 .重建索引使用的函数是_reindex_。
5 .Pandas的plot绘制直方图时,kind取值为_hist_。
6 .Pandas中drop方法中的参数how取值为_all_时,表示某行全部为缺失值才丢弃该行。
7 .Pandas中删除数据时,行列数据通过参数_axis_确定删除的是行还是列。
8 .数组转置是数据重塑的一种特殊形式,可以通过_transpose_方法或数组的T属性实现。
9 .Matplotlib中绘图时的参数_alpha_用于设置点的透明度。
10 .Matplotlib配置了配色方案和默认设置。全局参数定制和_rc参数设置_方法设置参数。
11.属性 shape 返回的是_数组的维度_。
12. Series 是一种一维数组对象,包含一个值序列。Series 中的数据通过__索引___访问。
13.a = numpy.array([1,2,3])
b = numpy.array([4,5,6])
a+b
上述代码运行的结果是: 。答案: [5,7,9];5,7,9 ;5,7,9; array([5,7,9])
14.reindex 方法中的参数 method 可以取值为‘ffill’和‘bfill’,分别指前向值填充和 向后值填充
15._figure()_函数可以实现画布的创建。
16.Pandas 中 drop 方法中的参数 how 取值为 any 时,表示某行只要有缺失值就丢弃该行。
17.a=np.arange(8).reshape(2,4),np.hsplit(a,2)返回值是_________________________________。
答案: array([[0, 1], [4, 5]]), array([[2, 3], [6, 7]])];[[[0, 1], [4, 5]],[[2, 3], [6, 7]]];( [0, 1], [4, 5],[2, 3], [6, 7])
18.修改数据中的参数“inplace”的含义是_____源数据就地修改______。
答案: 源数据就地修改;是否在原数据上修改;是否替换原数据;数值在原地修改;原数值处修改
19.补充实现交换数组 np.arange(9).reshape(3,3)中的第 1 列和第 2 列的代码。
array=np.arange(9).reshape(3,3)
array=__________________________。 答案: array[:,[1,0,2]]
20.有 arr = np.arange(12).reshape(3,4),则 arr[1:2,(0, 3)]对应的元素是 4 和____7______。
21.创建一个范围在(1,2)之间长度为 12 的等差数列的语句是 。答案:np.linspace(1,2,12)
22.a = numpy.array([4,3,4])
b = numpy.array([1,5,9])
a+b
答案: [5,8,13];5,8,13
23.Pandas 进行数据运算时,若存在不同索引会进行对齐,此时将引入 NAN值 。
24.Numpy 中的 random 模块中的函数 shuffle 的功能是对一个序列进行_随机排序_。
25.Pandas 中直接删除数据的方法是____drop__。
26.表达式 np.ones((3,4)).sum()的值为 12 。
27.已知字典dic={‘w’:97,’a’:19},则dic.get(‘w’, None)的值是__97__。
28.实现将数组a = np.arange(10).reshape(2,-1)和数组b = np.repeat(1,10).reshape(2,-1)水平堆叠的语句为__np.hstack((a,b))___。
29.创建一个4*4的全零矩阵对象d2= _np.zeros(4,4)_。
30.表达式np.ones((7,7)).sum()的值为 ___49___。
31.字典中的键值对用_____冒号_____分割。
32.Numpy中reshape( )函数主要作用是___重置数组的形状___。
33.Numpy中的ndarray的size属性返回的是_数组元素个数_。
34.创建一个元素为从10到49的ndarray对象d1=_np.arrange(10,49,1)_。
35.Pandas中的_groupby__方法可以根据索引或字段对数据进行分组。
36.DataFrame.replace({'B':'E','C':'F'})表示将表中的B替换为__E_ ,C替换为F。
37.绘图时可以通_text_位置加入注释,也可以通过annotate 在图中实现带有指向型的文本注释。答案: text;text();text()
38.__xlabel_函数可以在绘制图表时,设置x轴的名称。答案:xlabel;xlabel();xlabel()