爬虫开发(考试)

(爬虫开发)共80道包含 单选、多选、填空、判断

大数据采集与爬虫习题答案完整
第一章一、判断题
1、以下选项不属于程序设计语言类别的是(D)A..机器语言B..汇编语言C..高级语言D..解释语言
2、下列Python语句正确的是(D)A、min = x if x < y else y B、max = x > y ? x : y C、if (x > y) print x D、while True : pass 
3、以下不能创建一个字典的语句是(C)A、dict1 = {} B、dict2 = { 3 : 5 } 
C、dict3 = {[1,2,3]: “uestc”} D、dict4 = {(1,2,3): “uestc”}
二、判断题
4、模块文件的扩展名不一定是 .py。(错)
5、字符和列表均支持成员关系操作符(in)和长度计算函数(len())。(对)
答案:1、D 2、D 3、C 4、错5、对
第二章 一、选择题 
1、以下哪些是爬虫技术可能存在风险    ( D ) 
A、大量占用爬去网站的资源 B、网站敏感信息的获取造成的不良后果 C、违背网站爬去设置 D、以上都是
 2、下面表示一个文本类型的是( B <html)   A、<head    B、<html   C <meta D<title 
3、Tag有很多方法和属性,下列哪个属性不是Tag中最重要的属性 ( D) A、name     B、attributes     C、string     D、type 
二、判断题 
4、纵向爬虫主要面向大范围精确信息的爬取。   (错) 
5、URL包含的信息指出文件的位置以及浏览器应该怎么处理它,所 有互联网上的每个文件都有一个唯一的URL。     ( 对 ) 
答案:1、D  2、B  3、D  4、错  5、对 
第三章 一、选择题 
1、下列四项中,不属于数据库系统特点的是(  c) A、数据共享   B、数据完整性   C、数据冗余度高  D、数据独立性高 
2、数据库系统的数据独立性体现在    ( b ) A、不会因为数据的变化而影响到应用程序
B、不会因为系统数据存储结构与数据逻辑结构的变化而影响应用程序  C、不会因为存储策略的变化而影响存储结构  D、不会因为某些存储结构的变化而影响其他的存储结构 
3、.在数据结构中,从逻辑上可以把数据结构分成( c ) A、动态结构和静态结构     B、紧凑结构和非紧凑结构  C、线性结构和非线性结构     D、内部结构和外部结构  
二、判断题 
4、数据存储反映的是系统中静止的数据,表现出静态数据的特征。( √ ) 
5、.每种数据结构都具备3个基本运算:插入、删除和查找。  ( × ) 
答案:1、C  2、B  3、C  4、对  5、错  
第四章 一、选择题 
1、对字符串的说法正确的是  ( D ) A、字符串是基本数据类型 B、字符串值存储在栈内存中 C、字符串值初始化后可以被改变 D、字符串值一旦初始化就不会被改变 
2、能切割字符串的方法是   (  C ) A、indexOf( )   B、substring( )   C、split( )   D、trim( ) 
3、1.String类中的getBytes()方法的作用是   (   C ) A、将整数变成字符串 B、将字符串变成字符数组 C、将字符串变成字节数组 D、获取中字符串中字符的个数 
二、判断题 
4、WEB API最主要的功能是实现构建基于HTTP的面向各种客户端的服务框架。( 对 ) 
5、GitHub能够快速,高效地处理各种大小项目的版本控制和管理。 (对  ) 
答案:1、D  2、C  3、C  4、对  5、对

第五章 一、选择题 
1、ajax中基本请求方式是什么  ( A) A、get  B、post  C、request  D、kill 
2、以下哪个技术不是Ajax技术体系的组成部分  ( B ) A、XMLHttpRequest  B、DHTML  C、CSS  D、DOM 
3、下列哪个工具不能用来调试浏览器中的JavaScript   (  B) A、MS Visual InterDev B、Eclipse C、MS Script Debugger D、Mozilla Venkman 
二、判断题 
4、动态数据的准备和系统切换的时间没有直接关系。   ( 错 ) 
5、ajax的get请求和post请求基本无区别。(错  ) 
答案:1、A  2、B  3、B  4、错 5、错     
第六章 一、选择题 
1、目前验证码的类型有  ( D ) A、单击式验证码 B、图形验证码 C、滑动验证码 D、以上都是 
2、以下关于加大验证码破解难度说法错误的是  (  D ) A.现在大部分主流网站的验证码都进行了扭曲、粘连、加干扰线等设计 B.那些数字加字母的组合,特别是字母中还要区分大小写的,字符集就会大很多 C.使用中文字符 D.字符中间加空格 
3、在Web页面中增加验证码功能后,下面说法正确的是   ( A ) A、可以增加账号破解等自动化软件的攻击难度 B、可以防止文件包含漏洞 C、可以防止缓冲溢出 D、可以i防止浏览 
二、判断题 
4、验证码是一种用来区分计算机行为和人类行为的测试程序。   ( 对 ) 
5、“参数说明”表示该API可以接收和发送的参数名称和类型。  ( 对 ) 
答案:1、D  2、D  3、A  4、对5、对  
第七章 一、选择题 
1、Web容器在收到浏览器请求时,会如何处理请求   ( B  ) A、使用单一执行绪处理所有请求  B、一个请求就建立一个执行绪来处理请求 C、一个请求就建立一个行程来处理请求 D、一个请求就执行一个容器来处理请求 
2、以下哪个选项不使用POST请求来发送   ( C ) A、使用者名称、密码 B、档案上传  C、搜寻引擎的结果画面  D、BLOG文件 
3、【多选】GET请求和POST请求的区别有哪些   (ABD  ) A、安全 B、信息获取一致性 C、获取数据的长度一致 D、数据承载大小的不同 
二、判断题 
4、在HTTP超文本传输协议中规定了四种与服务器进行交互的方式:GET,POST, PUT和DELETE。                                         ( 对 ) 
5、Session是以数组的形式通过Sessionid进行检索的在服务器端存储的数据。 (错)
答案:1、B  2、C  3、ABD  4、对  5、错 
第八章 一、选择题 
1、下列哪项不是Scrapy的组件  ( C ) A、Selector B、Spider C、namenode D、Downloader Middleware  
2、HTML的缩写是  ( C ) A、Hybrid Text Multipurpose Language B、High Texture Modular Language C、Hyper Text Markup Language D、Hyper Text Middleware Language   
3、【多选】下列哪些是Spider中重要的属性   ( ABC ) A、logger  B、name C、settings D、test 
二、判断题 
4、Scrapy在某些请求失败或在处理它时发生错误,也可以继续运行其他请求。( 对 ) 
5、lxml是一个基于ElementTree的python API的XML解析库。(  对) 
答案:1、C  2、C  3、ABC  4、对  5、对

另一页

  1. 列表对象的排序方法sort____只能按元素从小到大排列,不支持别的排序方式。(X)
    sort方法可升序,可降序
  2. 形参可以看做是函数内部的局部变量,函数运行结束之后形参就不可访问了(√)
  3. 一个函数如果带有默认值参数,那么必须所有参数都设置默认值。(×)
  4. 表达式 ‘a’+1的值为’b’(X)
  5. 已知x为非空列表,那么执行语句x[0] = 3之后,列表对象x的内存地址不变(
  • 1
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值