爬虫面试题（简单操作题部分）

最新推荐文章于 2023-06-12 15:41:55 发布

XIAOTWOB

最新推荐文章于 2023-06-12 15:41:55 发布

阅读量343

点赞数

分类专栏：个人知识补充文章标签：爬虫面试题-简单操作题

本文链接：https://blog.csdn.net/XIAOTWOB/article/details/99946337

版权

本文整理了170道爬虫相关面试题中的简单操作题，涉及文件读取、JSON序列化、日期处理、列表操作等内容。如：read、readline、readlines的区别，JSON序列化处理datetime的方法，合并排序文件内容的实现，使用datetime.timedelta计算日期，创建返回乘积函数的闭包，以及用一行代码输出偶数等。

摘要由CSDN通过智能技术生成

在痴海的公众号看到了170道爬虫相关的题目，也参考了一些大佬的答案（主要是葫芦娃的爷爷，https://blog.csdn.net/qq_20728575/article/details/91385378），整理如下～

1.在读文件操作的时候会使用 read、readline 或者 readlines，简述它们各自的作用
答：read将整个文本都读取为一个字符串，占用内存大，readline读取为一个生成器，支持遍历和迭代，占用空间小。readlines将文本读取为列表，占用空间大。

2.json序列化：序列化是将对象状态转换为可保持或可传输的格式的过程。与序列化相对的是反序列化，它将流转换为对象。这两个过程结合起来，可以轻松地存储和传输数据。

3.json 序列化时，可以处理的数据类型有哪些？如何定制支持 datetime 类型？
答：字符串、数字（整数和浮点数）、字典、列表、布尔值、None。使用strftime将datetime格式化为标准字符串类型即可。

4.json 序列化时，默认遇到中文会转换成 unicode，如果想要保留中文怎么办？

import json
a=json.dumps({"name"："张三"},ensure_ascii=False)
print(a)

5.有两个磁盘文件 A 和 B，各存放一行字母，要求把这两个文件中的信息合并(按字母顺序排列)，输出到一个新文件 C 中。
答：读取两个文件，利用split函数将字符串切割成列表，再将两个列表合并，利用sort函数对

最低0.47元/天解锁文章