数据清洗与融合-期末复习题

  • 选择题

1 .Jupyter notebookcell中安装包语句正确的是(C)

A . pip install 包名 B . conda install 包名  C . !pip install 包名 D . !conda install 包名

2 .字符串是一个字符序列,例如:字符串s,从右侧向左第3个字符用什么索引?(B)

A . s[3]   B . s[-3]  C . s[0:3]  D . s[:-3]

3 .利用下面哪个可视化绘图可以发现数据的异常点(C)

A . 密度图  B . 直方图  C . 盒图  D . 概率图

4 .以下( )函数可以在绘制图表时,设置x轴的名称(C)

A . xlim()  B . ylim()  C . xlabel()   D . xticks()

5 .Matplotlib中哪个包提供了一批操作和绘图函数?(A)

A . pyplot   B . Bar   C . rcparams  D . pprint

解析:pyplot : Matplotlib的子库,提供了和MATLAB类似的绘图API。

6 .Jupyter notebook不具备的功能是 ( D )

A . Jupyter notebook可以直接生成一份交互式文档

B . Jupyter notebook可以安装Python库

C . Jupyter notebook可以导出HTML文件

D . Jupyter notebook可以将文件分享给他人

7 .Numpy中统计数组元素个数的方法是 (  C )

A . ndim   B . shape  C . size  D . itemsize

8 .Jupyter notebook的命令模式下,查看所有快捷键应该按下的键是 (C  )。

A . M   B . ESC   C . H   D . A   

9 .以下关于绘图标准流程说法错误的是(B ) 

A . 绘制简单的图形可以使用缺省的画布

B . 添加图例可以在绘制图形之前

C . 添加x轴,y轴的标签可以在绘制图形之前

D . 修改x轴标签,y轴标签和绘制的图形没有先后

10 .以下说法错误的是(C ) 

A . 饼图一般用于表示不同分类的占比情况。

B . 箱线图展示了分位数的位置。

C . 散点图无法反映特征间的统计关系。

D . 词云对于文本中出现频率较高的关键词予以视觉上的突出。

11 .下面不属于python特性的是(C )

A . 简单易学  B . 免费开源  C . 属于低级语言  D . 高可移植性

12 .以下说法错误的是( C)

A . 饼图一般用于表示不同分类的占比情况。

B . 箱线图展示了分位数的位置。

C . 散点图无法反映特征间的统计关系。

D . 词云对于文本中出现频率较高的关键词予以视觉上的突出。

13 .下列参数中调整后显示中文的是( C)

A . lines.linestyle  B . lines.linewidth  C . font.sans-serif  D . axes.unicode_minus

14 .下列选项中不能创建Numpy数组的选项是(B )

A . a = numpy.array([1,2,3])   B . a = numpy.array([1,[1,2,3],3])

C . a = numpy.array([[1,2,3],[4,5,6]])

D . a = numpy.array([[‘xiao’,’qian’],[‘xiao’,’feng’]])

15 .Numpy提供了两种基本对象,一种是ndarray,另一种是(B )

A . array   B . func  C . matrix  D . Series

16 .下列参数中调整后显示中文的(C )

A . lines.linestyle  B . lines.linewidth  C . font.sans-serif  D . axes.unicode_minus

17 .创建画布需要使用(A )函数

A . figure( )  B . add_subplot( )  C . Figure( )  D . Add_subplot( )

18 .下列说法正确的是(D )

A . count函数用于数据中的所有数据

B . 统计时使用descript函数,最后结果不会出现min项

C . diff表示三阶差分

D . var函数用作方差统计

19 .Numpy.random模块中用于对一个序列进行随机排序的函数是(B )

A . uniform  B . shuffle   C . permutation  D . normal

20 .以下关于缺失值检测的说法中,正确的是(D )

A . null和notnull可以对缺失值进行处理

B . dropna方法既可以删除观测记录,还可以删除特征

C . fillna方法中用来替换缺失值的值只能是数据框

D . Pandas库中的interpolate模块包含了多种插值方法

21 .Jupyter notebook中按(B )键进入命令模式。

A . 回车键  B . ESC  C . Ctrl+enter  D . A

22 .设置索引使用哪种方法。(D )

A . merge()方法  B . concat()方法 C . to_datetime()方法  D . set_index()方法

23 .在以下Pandas方法中不能实现实现合并数据的函数是( A)

A . agg()函数  B . concat()函数 C . join()方法  D . merge()函数

24 .下列说法不正确的是( B)。

A . union用于计算索引的交集

B . isin用于数据是否包含在其中

C . insert函数可以插入索引

D . unique用于计算索引中的唯一数组

25 .在绘制图形是需要使用( A)x轴数据范围进行限制 。

A . xlim( )   B . xticke( )  C . legend( )  D . show( )

26 .以下哪条语句定义了一个Python字典。( A)

A . {}   B . {1,2}  C . [1,2]  D . (1,2 )  

27 .下列说法正确的是( A)。

A . Series对象的结构比DataFrame对象的结构简单

B . DataFrame可以看成Series的子集

C . sort_index用作索引重建

D . HDF4格式文件可以与HDF5文件兼容

28 .NumPy中创建一个元素均为0的数组可以使用(A )函数。

A . zeros( )   B . arange( )   C . linspace( )   D . logspace( )

30 .Numpy中的diag函数用于创建(A )

A . 对角矩阵  B . 三角矩阵 C . 值为1的矩阵  D . 值为0的矩阵  

31 .循环结构可以使用Python语言中的( B)语句实现。

A . print   B . while   C . loop   D . if

32 .使用( A)函数可以将配置文件重置。

A . rcdefault( )  B . matplotlib_fname( )   C . get_configdir( )   D . rc_params( )

33 .下列选项中不是矩阵选项的是(D )

A . A   B . I   C . H   D . B  

34 .进行数据的占比比较时使用C )表示。

A . 散点图  B . 直方图  C . 饼状图  D . 折线图

35 .以下哪个函数可以实现画布的创建?(C )

A . subplots( )  B . add_subplot( )  C . figure( )  D . subplot2grid( )

36 .创建一个3*3的数组,下列代码中错误的是( C)

A . np.arange(0,9).reshape(3,3)     B . np.eye(3)

C . np.random.random([3,3,3])     D . np.mat(“ 1,2,3;4,5,6;7,8,9”)

37 .Python中定义函数的关键字是(A )

A . def   B . define   C . function  D . defunc

38 .分析股票你选择用哪种分析方法(C )

A . 聚类  B . 一元线性回归  C . 时间序列   D . 多元线性回归

39 .下列代码运行的结果是( B

a = numpy.array([1,2,3])  

b = numpy.array([4,5,6])

a+b

A . [1,2,3,4,5,6]   B . [5,7,9]   C . 21   D . 12   

  • 填空题

1 .CSV文件也称为字符分隔值文件,默认情况下以_逗号_进行分隔。

2 .Python中要使字符串转义字符不转义,则直接在字符串前加字符__r__。 

3 .创建一个范围在(0,1)之间的长度为12的等差数列的语句是_np.linspace(0,1,12)_.

4 .重建索引使用的函数是_reindex_。

5 .Pandas的plot绘制直方图时,kind取值为_hist_。 

6 .Pandas中drop方法中的参数how取值为_all_时,表示某行全部为缺失值才丢弃该行。 

7 .Pandas中删除数据时,行列数据通过参数_axis_确定删除的是行还是列。 

8 .数组转置是数据重塑的一种特殊形式,可以通过_transpose_方法或数组的T属性实现。 

9 .Matplotlib中绘图时的参数_alpha_用于设置点的透明度。 

10 .Matplotlib配置了配色方案和默认设置。全局参数定制和_rc参数设置_方法设置参数。

11.属性 shape 返回的是_数组的维度_

12. Series 是一种一维数组对象,包含一个值序列。Series 中的数据通过__索引___访问。

13.a = numpy.array([1,2,3])

b = numpy.array([4,5,6])

a+b

上述代码运行的结果是:        答案: [5,7,9];5,7,9 ;5,7,9; array([5,7,9])

14.reindex 方法中的参数 method 可以取值为‘ffill’和‘bfill’,分别指前向值填充和 向后值填充

15._figure()_函数可以实现画布的创建。

16.Pandas drop 方法中的参数 how 取值为   any  时,表示某行只要有缺失值就丢弃该行。

17.a=np.arange(8).reshape(2,4)np.hsplit(a,2)返回值是_________________________________

答案: array([[0, 1], [4, 5]]), array([[2, 3], [6, 7]])];[[[0, 1], [4, 5]],[[2, 3], [6, 7]]];( [0, 1], [4, 5],[2, 3], [6, 7])

18.修改数据中的参数“inplace”的含义是_____源数据就地修改______

答案: 源数据就地修改;是否在原数据上修改;是否替换原数据;数值在原地修改;原数值处修改

19.补充实现交换数组 np.arange(9).reshape(3,3)中的第 1 列和第 2 列的代码。

array=np.arange(9).reshape(3,3)

array=__________________________答案: array[:,[1,0,2]]

20.arr = np.arange(12).reshape(3,4),则 arr[1:2,(0, 3)]对应的元素是 4 ____7______

21.创建一个范围在(1,2)之间长度为 12 的等差数列的语句是     答案:np.linspace(1,2,12)

22.a = numpy.array([4,3,4])

b = numpy.array([1,5,9])

a+b

答案: [5,8,13];5,8,13

23.Pandas 进行数据运算时,若存在不同索引会进行对齐,此时将引入  NAN值

24.Numpy 中的 random 模块中的函数 shuffle 的功能是对一个序列进行_随机排序_

25.Pandas 中直接删除数据的方法是____drop__

26.表达式 np.ones((3,4)).sum()的值为  12    

27.已知字典dic={‘w’:97,’a’:19},则dic.get(‘w’, None)的值是__97__。

28.实现将数组a = np.arange(10).reshape(2,-1)和数组b = np.repeat(1,10).reshape(2,-1)水平堆叠的语句为__np.hstack((a,b))___。

29.创建一个4*4的全零矩阵对象d2= _np.zeros(4,4)_。

30.表达式np.ones((7,7)).sum()的值为 ___49___。

31.字典中的键值对用_____冒号_____分割。

32.Numpy中reshape( )函数主要作用是___重置数组的形状___。

33.Numpy中的ndarray的size属性返回的是_数组元素个数_。

34.创建一个元素为从10到49的ndarray对象d1=_np.arrange(10,49,1)_。

35.Pandas中的_groupby__方法可以根据索引或字段对数据进行分组。

36.DataFrame.replace({'B':'E','C':'F'})表示将表中的B替换为__E_ ,C替换为F。

37.绘图时可以通_text_位置加入注释,也可以通过annotate 在图中实现带有指向型的文本注释。答案: text;text();text()

38.__xlabel_函数可以在绘制图表时,设置x轴的名称。答案:xlabel;xlabel();xlabel()

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值