aaaaaaa

单选题
在Linux系统下安装ntp服务的命令正确的是( A )。
A.yum  install  ntp
B.yum  remove  ntp
C.yum  update  ntp
D.yum  list
在实际生广环境中获取的数据可能存在缺失值,为了更好地进行数据分析,通常需要对缺失数据进行识别和处理,下列关于DataFrame.dropna()方法说法正确的是( C )。
A.DataFrame.dropna(axis=1,inplace=True):删除带有空值的行
B.DataFrame.dropna(axis-0,inplaces=Tnue):删除带有空值的列
C.DataFrame.dropna(axis=0,‘how=any’,inplace=True):删除带有空值的行
D.DataFrame.dropna(axis=1,‘how=all’,inplace=True):删除全部为空值的行
下列关于Selenium库的方法和作用不对应的是( C )。
A.element_to_be_clickable()方法:元素可点击
B.element_to_be_selecte()方法:元素可选择,传入元素对象
C.element_located_to_be_selected()方法:元素可选择,传入定位列表
D.invisibility_of_element_located()方法:元素不可见
正确搭建Hadoop集群的步骤是( A )。
①克隆虚拟机
②配置SSH免密码登录
③格式化
④修改配置文件
⑤配置时间同步服务
A.④①②⑤③
B.③②①⑤④
C.⑤①③②④
D.②⑤④①③
若需要构建KNN模型,则在sklearn.neighbors模块中可使用的类是( B ),
A.DecisionTreeClassifier
B.KNeighborsClassifier
C.MLPClassifier
D.KNN
在pandas库中,下列关于DataFrame.groupby()方法说法错误的是(C)。
A.DataFrame.groupby()方法用于数据框分组聚合过程中的分组操作
B.使用DataFrame.groupby()方法分组后的结果并不能直接查看,而是被存在内存中
C.group_keys参数指是否在运行的情况下对返回数据进行降维
D.as_index参数指聚合后的聚合标签是否以DataFrames索引形式输出
下列关于sklearn库的预处理类说法正确的是( B )
A.MinMaxScaler:对特征进行标准差标准化
B.StandardScaler:对特征进行标准差标准化
C.FunctionTransformer:对定量特征进行二值化处理
D.OneHotEncoder:对特征进行自定义函数变换
在HTTP请求过程中,客户端与服务器间的请求与响应的具体步骤为( C )。
①发送HTTP请求
②释放连接TCP连接
③连接Web服务器
④服务器接受请求并返回HTTP响应
⑤客户端解析HTML内容
A.③②①④⑤
B.①③④②⑤
C.③①④②⑤
D.①②③④⑤
在HTTP请求中,客户端向服务器发送一个请求报文,报文中的内容不包括( D ),
A请求的方法
B.URL
C.请求头部
D.响应头部
在Matplotlib库中,设置图形的x轴名称的函数是( C )。
A.matplotlib.pyplot.ylim()函数
B.matplotlib.pyplot.xlim()函数
C.matplotlib.pyplot.xlabel()函数
D.matplotlib.pyplot.ylabel()函数
下列代码的输出结果是( D )
result=list(map(lambda x:x*x,[1,2,3,4,5,6,7,8,9]))
print(result)
A.2,6,12,20,30,42,56,72]
B.[362880]
C.[1,2,3,4.5,6,7,8,9]
D.[1,4,9,16,25,36,49,64,81]

在HTML中,下列状态码表示请求成的是( A ),
A.200
B.400
C.403
D.500
在NumPy库中,下列不属于数组的属性的是( D )。
A.ndim
B.shape
C.size
D.add
通过代码from skleam import metrics"导入评价指标模块后,若需要构建真实标签true_labe和模型预测标签predicted_label的混淆矩阵,则下列可使用的代码是( B )。
A.confusion_matrix(predicted_label,true_label)
B.metrics.confusion_matrix(true_label,predicted_label)
C.metrics.confusion_matrix(predicted_label,true_label)
D.confusion_matrix(true_label,predicted_label)
在Windows系统下,将数据框(DataFrame)对象text存储为D盘下的Excel文件,下列代码正确的是(   B ).
A.text.to_excel(‘D:\text.xisx’)
B.text.to_excel(‘D:\text.xlsx’)
C.text.to_csv(‘D:\text.xisx’)
D.text.to_csv(‘D:\text.xlsx’)
16.下列不属于HTTP/1.1协议请求方法的是( D  ).

A.GET
B.POST
C.DELETE
D.PUSH

关闭集群的具体步骤为( B  )。
①stop-dfs.sh
②stop-yaim.sh
③mr-jobhistory-daemon.sh stop historyserver
A.①②③
B.②①③
C.③②①
D.①③②
在通过代码"from sklearn import tree"导入决策树模块,并通过代码"clf=tree.DecislonTreeClassifler()"构造分类器对像后,分类器对象clf在训练时需要调用的方法是(  D ),
A.clf.train()
B.clf.learn()
C.clf.predict()
D.clf.fit()
在哑变量处理函数pandas.get_dummies()函数中,若要考虑缺失值的存在价值,则需调整的参数是( C  )。
A.prefix
B.prefix_sep
C.dummy_na
D.sparse
Matplotlib库是Python的常用绘图库,下列关于Matplotlib库说法错误的是(  D  )
A.matplotilib.pyplot.xlim():用于限制x轴的显示范围
B.matplotlib.pyplot.figure(figsize=(2,2)):用于创建画布,并设置画布的大小为(2,2)
C.matplotlib.pyplot.subplot(231):用于将图表的整个绘图区域分为2行3列的区域,绘制的图表位于区域中的第1行第1列
D.matplotlib.pyplot.plot(x,y,color=‘b’,linewidth=1.0,linestyle=‘_’:用于绘制折线图,其中参数"color=b"是将线的颜色设置为黑色
关于下列代码说法错误的是(   D  )。
import numpy as np
arr=np.array([0,1,2,3,4])
import pandas as pd
ser=pd.Series([0,1,2,3,4])
A.arr和ser虽然是不同的数据类型,但是同样可以进行加法运算
B.arr和ser表达同样的数据内容
C.arr和ser都是一维数据
D.arr参与运算的执行速度明显比ser快
下列代码的运行结果为( B   )。
import re
var = re.findall(‘.∗
.
∗
’,’(abc)def)[0]
print(var)
A.()
B.(abc)
C.def
D.(def)
下列关于BeautifulSoup中对象类型描述错误的是(   B )
A.name属性可以获取及修改Tag对像名称
B.attrs属性可获取Tag对象的HTML属性,返回值为列表形式
C.string方法可获取Tag对象中的文本字符串内容
D.NavigableString对象无法被编辑
若需要构建逻辑回归模型,则在sklearn.linear_model模块中可使用的类是(   A )
A.LogisticRegression
B.SVC
C.LinearRegression
D.DecisionTreeClassifier
下列关于Jupyter Notebook说法错误的是( B    )
A.Jupyter Notebook可以直接生成一份交互式文档
B.Jupyter Notebook不可以安装Python库
C.Jupyter Notebook可以导出HTML文件
D.Jupyter Notebook可以分享文件
在pandas库中,下列关于缺失值检测说法正确的是(  B  )。
A.DataFrame.isnull()方法可以对缺失值进行处理
B.DataFrame.dropna()方法既可以删除观测记录,也可以删除特征
C.DataFrame.fillna()方法中用于替换缺失值只能是数据框
D.DataFrame.replace()方法能直接对缺失值进行处理
在Matplotlib库中,下列关于柱状图bar函数的参数说法错误的是( B  )。
A.linewidth:表示柱状图中每根柱了边框完度
B.align:表示柱状图中每根柱子的高度
C.width:表示柱状图中每根柱子的宽度
D.color:表示柱状图中每根柱子的颜色
在pandas库中,下列不属于DataFrame.drop()方法的参数是(  C  )。
A.labels
B.level
C.dtype
D.inplace
下列关于pandas.concat()函数、DataFrame.append()方法、pandas.merge()函数和DataFrame.join()方法的说法正确的是(  D  )
A.pandas.concat()函数是常用的主键合并的函数,能够实现数据框之间的内连接和外连接
B.DataFrame.append()方法只能用于进行纵向堆叠,适用于所有数据框之间的纵向堆叠情况
C.pandas.merge()函数是常用的主键合并的函数,但不能够实现数据框之间的左连接和右连接
D.DataFrame.join()方法是常用的主键合并方法,但不能够实现数据框之间的左连接和右连接
.下列可以实现导入页面等待相关库的代码是(  B )。
A.from selenium import webdriver
B.from selenium.webdriver.support.ui import WebDriverWait
C.from selenium.webdriver.common.by import By
D.from selenium.webdriver.support import expected_conditions
若要创建一个3×3的数组,则下列代码错误的是(  C  )。
A.numpy.arange(0,9).reshape(3,3)
B.numpy.eye(3)
C.numpy.random.random([3,3,3])
D.numpy.array([[1,2,3],[4,5,6],[7,8,9]])
下列表示整型转化为布尔型的代码是(   D )。
A.print(‘转化结果为:’,np.f1oat64(42))
B.print(‘转化结果为:’,np.int8(42.0))
C.print(‘转化结果为:’,np.int(True))
D.print(‘转化结果为:’,np.bool(42))
多选题
列关于Matplotiib库说法错误的是(  CD  )
A.matplotlib.pyplot.figure(figsize=(2,2)):用于创建画布,并设置画布的大小为(2,2)
B.matplotlib.pyplot.plot(x,y,color-=‘r’,linewidth=5.O,linestyle=‘-’):用于绘制折线图,其中linewidth参数用于设置线的宽度
C.natplotlib.pyplot.plot(x,y.color=‘b’,linewidth=1.0,linestyle=‘-’):用于绘制折线图,其中参数”colar=b”是将线颜色设置为黑色
D.matplotlib.pyplot..subplot(2,2,1):用于将图表的整个绘图区域分为2行1列的区域,绘制的图表位于区域中的第2行第1列
下列属于数据清洗的操作是( ABCD  )。
A删除噪声数据
B.删除与挖掘主题无关的数据
C.处理缺失值
D.处理异常值
下列属于HDFS保正可靠性的措施的是( ABCD )。
A.冗余备份:每个文件存储成一系列数据块(Block),,为了提高容错率,文件的所有数据块都会有副本
B.副本存放:采用机架感知(Rak-aware)的策略来改进数据的可靠性、高可用和网络带宽的利用率
C.心跳检测:NameNode周期性地从集群中的每一个DataNode接受心跳包和块报告,若收到心跳包则说明该DataNode工作正常
D.数据完整性检测:HDFS客户端软件实现了对HDFS文件内容的校验和检查
下列属于Linux集群系统状态监控指标的是(ABCD  )。
A.load
B.CPU利用率
C.磁盘剩余空间
D.内存使用情况
下列关于sklear.model_selection模块中的train_test_split类的参数说法正确舶的是( ABD  )
A.test_size:测试集的大小
B.train_size:训练集的大小
C.andom_state:随机种子编号,默认为1
D.shuffle:是否在拆分前对数据进行洗牌
下列属于克隆CentOS6虚拟机之后需要修改的文件的是(  ABC )
A./etc/udev/rules.d/70-persistent-net.rules
B./etc/sysconfig/network-scriptd/ifcfg-eth0
C./etc/sysconfig/network
D./etc/sysconfig/network-scriptd/ifcfg
urllib库是Python内置的HTTP请求库,下列关于urllib库说法正确的是( AB )
A.urllib.request:请求模块
B.urllib.error:异常处理模块
C.urllib.parse:robots.txt解析模块
D.urllib.robotparser:URL解析模块
现有一个DataFrame格式的数据集data,“col_name”为data中的一个列名,下列关于填充缺失值代码的说去正确的是(  AD   )
A.data.fillna(0):用0对缺失值进行填充
B.data[‘ool_name’]fillna(data[‘col_name’].dropna().median(),inplace=True):用均值对缺失值进行填充
C.data[‘col_name’]fillna(method=’pad’):用缺失值的后一个数据对缺失值进行填充
D.data[‘col_name’].fillna(data[‘col_name’].dropna().mode()[0],inplace=True):用众数缺失值进行填充
下列属于HDFS针对数据流失可题提供的保护措施的是(  ABC  )。
A冗余备份
B.副本存放
C.宕机处理
D.固定副本个数
下列属于使用Pyecharts库可绘制的图表的是( ABCD   )。
A.日历图
B.漏斗图
C.仪表盘
D.关系图
聚焦网络爬虫又被称作主题网络爬虫,下列属于聚焦网络爬虫包括的爬行策略的是(  ABCDABC  )
A.基于内容评价的爬行策略
B.基于链接结构评价的爬行策略
C.基于增强学习的爬行策略
D.基于语境图的爬行策略
在pandas库中的DataFrame.duplicated()方法是针对DataFrame对像进行一个检查重复值操作,下列关于DataFrame.duplicated()方法中的参数说法正确的是(     ABC )
A.subset:列标签或标签序列,可选择仅考虑某些列来标识重复项,默认情况下使用所有列
B.keep=‘frst’:将重复项标记为"True",第一次出现的重复项除外
C.keep=‘last’:将重复项标记为"True"”,最后一次出现的重复项除外
D.kep=False:将所有重复项标记方"False"
urllib库是Python内置的HTTP请求库,下列关于urllib库说法正确的是(AB )
A.urllib.request:请求模块
B.urllib.error:异常处理模块
C.urllib.parse: robots.txt解析模块
D.urllib.robotparser:URL解析模块
在Numpy库中,下列关于切割2×2的二维数组arr的代码及其对应作用的说法正确的是(   ABC )
A.numpy.hsplit(arr,2):实现数组arr的横向分割
B.numpy.vsplit(arr,2):实现数组arr的纵向分割
C.numpy.split(arr,2,axis=1):实现数组arr的横向分割
D.numpy.split(arr,2,axis=2):实现数组arr的纵向分割
下列属于数据的质量相关因素的是(  ABCE   )
A数据的准确性
B.数据的完整性
C.数据的一致性
D.数据的可解释性
下列属于可以聚合数据的方法的是(  ABD  )。
A.DataFrame.agg()
B.DataFrame.apply()
C.DataFrame.pivot()
D.DataFrame.transform()
判断题
使用Python网络爬虫技术可以获取网页、图片和视频数据。(✔   )
在使用pandas.pivot_table()函数时,若不指定aggfunc参数使用的聚合函数,则会默认使用numpy.mean()函数进行聚合运算。( ✔   )
在Python环境中,Seaborn库、Matplotlib库和BeautifulSoup库均主要用于数据可视化分析。(  ✔  )
在NumPy库中,使用数组进行简单统计分折的排序方法有直接排序和间接排序。(  ✔  )
NumPy数组的水平分割采用vsplit函数,其等价于numpy.split(axis=1).( ✘ )
水球图是一种拟物化的图表,能够直观地表现出某个帽标指标的进度或是实际情况.在pyecharts库中,水球图可以设置波浪颜色,但波浪状态不可以设置为动态,只能是静态的.(  ✘ )
在pandas库中,使用pivot_table函数创建透视表时,分组键index有且只能有一个。(✘   )
在数据可视化报告中只需要包含图形,不需要对图形进行分析。(  ✘  )
在Linux系统中,为使其它用户可直接使用“cd”命令进入某目录,该目录需预先设置其它用户的读权限。(  ✘ )
离散属性的值只能是有限个。(   ✘)
K均值聚类是一种基于密度的聚类算法,聚类个数可由算法自动地确定。( ✘ )
在MySQL中,拥有最高权限的超级用户的用户名为Administrator。(✘   )
51.数据挖据的主要任务是从数据中发现潜在的规则,从而能更好地完成描述数据和预测数据等任务。(  ✔  )

在使用Requests库时,若想修改和添加Request库中的headers对像,则可以使用add_header()方法( ✔  )
53.在Python环境中,被三引号包围的一定是字符串(  ✔ )

54.在train_test_split函数中,test_size参数表示测试集的大小(  ✔  )

55.Hadoop框架是用Java实现的(  ✔ )

56.在服务端HTTP的响应状态码中,403表示服务器无法找到请求页面。( ✘  )

57.K-Means算法一般采用欧式距离作为样本间相似性的度量,即认为两个样本的距离城近,其相以性就越大(   ✔ )

58.Linux操作系统的管理员权限和普通用户权限相同( ✘  )

re.findall()函数的作用是在字符串中找到同正则表达式所匹配的所有子字符串,并返回一个列表,如果没有找到匹配的,则返回空列表。( ✔  )
数据可视化旨在借助图形化手段,清晰有效地传达出繁杂数据中的信息。( ✔)
如果缺失数据太多,可以建立模型,使用插补方式来填充数据。(   ✔  )
在Pandas库中,预处理缺失值时可以使用DataFrame.isnull()方法来判断数据框中的元素是否为缺失值.(   ✔  )
在Pandas库中DataFrame对象使用duplicated()方法可以删除数据中的重复项。(   ✘ )
Seaborn库比Matplotlib库功能更多,可以独立于Matplotlib库进行使用( ✘   )
网络爬虫是一个自动下载网页的计算机程序或者一个自动化脚本。(   ✔  )
在使用Seaborn库绘图时,可以输入代码”sns.set_style(‘white’)”将画布背景设置为白色.( ✔    )
67.在正则表达式语法中,“.”可以匹配任意字符。(✘   )

68.在MySQL中,拥有最高权限的超级用户的用户名为Administrator。(  ✘  )

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
### 回答1: a的值为97,因此: a = 97 aa = 97 * 97 = 9409 aaa = 97 * 97 * 97 = 916,129 aaaa = 97 * 97 * 97 * 97 = 88,579,906,929 ### 回答2: Python可以计算a、aa、aaa、aaaa这几个字符串的和。要实现这个功能,我们可以采用循环结构和字符串拼接的方式。我们可以尝试如下代码: ``` a = "a" res = 0 for i in range(len(a), len(a)*4 + 1, len(a)): res += int(a*i) print(res) ``` 首先,我们定义了一个字符串a和一个变量res,后者用于保存求和的结果。接下来,我们使用for循环从a的长度开始,每次增加a的长度,一直循环到长度为4a为止。 在每一次迭代中,使用字符串拼接的方式生成一个长度为i的字符串。具体可以使用a*i的方式实现,其中*表示字符串复制操作。如a*2实际上就是生成了一个"aa"的字符串。同时,我们也将这个字符串转换为整数,并将其加入到res中。 最终求和的结果将被打印出来。 需要注意的是,这个代码中的字符串拼接操作可能稍慢一些。如果我们需要提高代码的执行速度,可以使用列表等数据结构来替代字符串拼接。我们也可以对循环结构进行优化,包括提前计算出循环次数等等。 ### 回答3: 小学生都可以计算1+11+111+1111,那么计算a aa aaa aaaa,实际上思路也是类似的。 首先我们来理解一下问题,a aa aaa aaaa是一个数列,其实就是a、aa、aaa、aaaa四个数的和。 那么,我们可以用一个for循环和一个累加器来解决这个问题。 首先,我们定义一个变量i,用于表示数列中的每一项,i的初始值为a,step为aa,每次迭代加上一个step,共迭代4次。 然后,我们定义一个累加器sum,用于将每一项加起来。 最后,输出sum的值,即a aa aaa aaaa的和。 具体代码如下: a = 1 step = 10 sum = 0 for i in range(1, 5): sum += a * i a += step print(sum) 运行程序,输出结果为1234,即a aa aaa aaaa的和是1234。 这里需要说明一下,我们假设a是1,step是10,实际上可以根据需要修改。 在这个问题中使用for循环是非常方便的,因为我们已经知道了要迭代多少次。但如果要计算更长的数列,for循环可能会比较麻烦,这时可以考虑使用while循环。 总之,计算a aa aaa aaaa并不是一个难题,只要有合适的思路和编程能力就可以轻松解决。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值