python爬虫实战：利用pyquery爬取猫眼电影TOP100榜单内容-2

Ting说

于 2018-05-11 20:14:04 发布

阅读量1.3k

点赞数

分类专栏： Python 文件创建 pyquery 爬虫

本文链接：https://blog.csdn.net/myself029/article/details/80286119

版权

本文主要介绍了对之前使用PyQuery爬取猫眼电影TOP100榜单代码的优化，包括取消不必要的create_file函数，简化电影信息字典的赋值过程，提高代码的简洁性和效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

上次利用pyquery爬取猫眼电影TOP100榜单内容的爬虫代码中点击打开链接存在几个不合理点。

1. 第一个就是自定义的create_file（文件存在判断及创建）函数。

我在后来的python文件功能相关学习中，发现这个自定义函数属于重复造轮子功能。因为 for data in page.items()这个页面内容提取的循环体中包含的下面代码中with open方法即存在文件存在判断和创建功能。所有没有必要单独自定义create_file函数的必要。

for data in page.items():  #  遍历该页所有node的内容，并获取对应的目标值，然后写入本地
		# print(data,type(d