测验1: Python网络爬虫之规则 (第1周)
1.下面哪些功能网络爬虫做不到?
A
分析教务系统网络接口,用程序在网上抢最热门的课。
B
持续关注某个人的微博或朋友圈,自动为新发布的内容点赞。
C
爬取某个人电脑中的数据和文件。
D
爬取网络公开的用户信息,并汇总出售。
正确答案: C
个人电脑中数据没有联网且没有通过Web服务器以URL形式被网络访问,则不能用爬虫获取。
切记,及时能爬取数据,数据的知识产权仍然受保护,商业获利(出售)将涉嫌违法。
2.以下选项不是Python Requests库提供方法的是:
A
.head()
B
.post()
C
.push()
D
.get()
正确答案: C
Requests库共有7个主要方法:request()、get()、head()、post()、put()、patch()、delete(),名字基本与HTTP的操作相同。
3.在Requests库中,以下哪个函数是基础性函数?即,只需要一个函数即可完成全部功能。
A
request()
B
delete()
C
post()
D
get()
正确答案: A
request()是其他所有函数的基础函数,完成所有功能,其它函数只是它的一种封装形式。
4. 在Requests库中,体现推送数据操作的函数是:
A
head()
B
get()
C
patch()
D
delete()
正确答案: C
数据推送(push model)一般指将数据发送出去的行为。在Requests库中,post()、put()、patch()都体现这种行为模式。
5.Requests库中的get()方法最常用,下面哪个说法正确?