(爬虫开发)共80道包含 单选、多选、填空、判断
大数据采集与爬虫习题答案完整
第一章一、判断题
1、以下选项不属于程序设计语言类别的是(D)A..机器语言B..汇编语言C..高级语言D..解释语言
2、下列Python语句正确的是(D)A、min = x if x < y else y B、max = x > y ? x : y C、if (x > y) print x D、while True : pass
3、以下不能创建一个字典的语句是(C)A、dict1 = {} B、dict2 = { 3 : 5 }
C、dict3 = {[1,2,3]: “uestc”} D、dict4 = {(1,2,3): “uestc”}
二、判断题
4、模块文件的扩展名不一定是 .py。(错)
5、字符和列表均支持成员关系操作符(in)和长度计算函数(len())。(对)
答案:1、D 2、D 3、C 4、错5、对
第二章 一、选择题
1、以下哪些是爬虫技术可能存在风险 ( D )
A、大量占用爬去网站的资源 B、网站敏感信息的获取造成的不良后果 C、违背网站爬去设置 D、以上都是
2、下面表示一个文本类型的是( B <html) A、<head B、<html C <meta D<title
3、Tag有很多方法和属性,下列哪个属性不是Tag中最重要的属性 ( D) A、name B、attributes C、string D、type
二、判断题
4、纵向爬虫主要面向大范围精确信息的爬取。 (错)
5、URL包含的信息指出文件的位置以及浏览器应该怎么处理它,所 有互联网上的每个文件都有一个唯一的URL。 ( 对 )
答案:1、D 2、B 3、D 4、错 5、对
第三章 一、选择题
1、下列四项中,不属于数据库系统特点的是( c) A、数据共享 B、数据完整性 C、数据冗余度高 D、数据独立性高
2、数据库系统的数据独立性体现在 ( b ) A、不会因为数据的变化而影响到应用程序
B、不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序 C、不会因为存储策略的变化而影响存储结构 D、不会因为某些存储结构的变化而影响其他的存储结构
3、.在数据结构中,从逻辑上可以把数据结构分成( c ) A、动态结构和静态结构 B、紧凑结构和非紧凑结构 C、线性结构和非线性结构 D、内部结构和外部结构
二、判断题
4、数据存储反映的是系统中静止的数据,表现出静态数据的特征。( √ )
5、.每种数据结构都具备3个基本运算:插入、删除和查找。 ( × )
答案:1、C 2、B 3、C 4、对 5、错
第四章 一、选择题
1、对字符串的说法正确的是 ( D ) A、字符串是基本数据类型 B、字符串值存储在栈内存中 C、字符串值初始化后可以被改变 D、字符串值一旦初始化就不会被改变
2、能切割字符串的方法是 ( C ) A、indexOf( ) B、substring( ) C、split( ) D、trim( )
3、1.String类中的getBytes()方法的作用是 ( C ) A、将整数变成字符串 B、将字符串变成字符数组 C、将字符串变成字节数组 D、获取中字符串中字符的个数
二、判断题
4、WEB API最主要的功能是实现构建基于HTTP的面向各种客户端的服务框架。( 对 )
5、GitHub能够快速,高效地处理各种大小项目的版本控制和管理。 (对 )
答案:1、D 2、C 3、C 4、对 5、对
第五章 一、选择题
1、ajax中基本请求方式是什么 ( A) A、get B、post C、request D、kill
2、以下哪个技术不是Ajax技术体系的组成部分 ( B ) A、XMLHttpRequest B、DHTML C、CSS D、DOM
3、下列哪个工具不能用来调试浏览器中的JavaScript ( B) A、MS Visual InterDev B、Eclipse C、MS Script Debugger D、Mozilla Venkman
二、判断题
4、动态数据的准备和系统切换的时间没有直接关系。 ( 错 )
5、ajax的get请求和post请求基本无区别。(错 )
答案:1、A 2、B 3、B 4、错 5、错
第六章 一、选择题
1、目前验证码的类型有 ( D ) A、单击式验证码 B、图形验证码 C、滑动验证码 D、以上都是
2、以下关于加大验证码破解难度说法错误的是 ( D ) A.现在大部分主流网站的验证码都进行了扭曲、粘连、加干扰线等设计 B.那些数字加字母的组合,特别是字母中还要区分大小写的,字符集就会大很多 C.使用中文字符 D.字符中间加空格
3、在Web页面中增加验证码功能后,下面说法正确的是 ( A ) A、可以增加账号破解等自动化软件的攻击难度 B、可以防止文件包含漏洞 C、可以防止缓冲溢出 D、可以i防止浏览
二、判断题
4、验证码是一种用来区分计算机行为和人类行为的测试程序。 ( 对 )
5、“参数说明”表示该API可以接收和发送的参数名称和类型。 ( 对 )
答案:1、D 2、D 3、A 4、对5、对
第七章 一、选择题
1、Web容器在收到浏览器请求时,会如何处理请求 ( B ) A、使用单一执行绪处理所有请求 B、一个请求就建立一个执行绪来处理请求 C、一个请求就建立一个行程来处理请求 D、一个请求就执行一个容器来处理请求
2、以下哪个选项不使用POST请求来发送 ( C ) A、使用者名称、密码 B、档案上传 C、搜寻引擎的结果画面 D、BLOG文件
3、【多选】GET请求和POST请求的区别有哪些 (ABD ) A、安全 B、信息获取一致性 C、获取数据的长度一致 D、数据承载大小的不同
二、判断题
4、在HTTP超文本传输协议中规定了四种与服务器进行交互的方式:GET,POST, PUT和DELETE。 ( 对 )
5、Session是以数组的形式通过Sessionid进行检索的在服务器端存储的数据。 (错)
答案:1、B 2、C 3、ABD 4、对 5、错
第八章 一、选择题
1、下列哪项不是Scrapy的组件 ( C ) A、Selector B、Spider C、namenode D、Downloader Middleware
2、HTML的缩写是 ( C ) A、Hybrid Text Multipurpose Language B、High Texture Modular Language C、Hyper Text Markup Language D、Hyper Text Middleware Language
3、【多选】下列哪些是Spider中重要的属性 ( ABC ) A、logger B、name C、settings D、test
二、判断题
4、Scrapy在某些请求失败或在处理它时发生错误,也可以继续运行其他请求。( 对 )
5、lxml是一个基于ElementTree的python API的XML解析库。( 对)
答案:1、C 2、C 3、ABC 4、对 5、对
另一页
- 列表对象的排序方法sort____只能按元素从小到大排列,不支持别的排序方式。(X)
sort方法可升序,可降序 - 形参可以看做是函数内部的局部变量,函数运行结束之后形参就不可访问了(√)
- 一个函数如果带有默认值参数,那么必须所有参数都设置默认值。(×)
- 表达式 ‘a’+1的值为’b’(X)
- 已知x为非空列表,那么执行语句x[0] = 3之后,列表对象x的内存地址不变(