如何用正则表达式finditer排行榜数据保存到csv.

最新推荐文章于 2024-08-13 18:29:56 发布

青龙摄影

最新推荐文章于 2024-08-13 18:29:56 发布

阅读量713

点赞数 19

文章标签： python

本文链接：https://blog.csdn.net/lfsysc/article/details/140455476

版权

import resonse
response = requests.get('https://movie.douban.com/chart', headers=headers)

obj = re.compile(
r'.*?<a class="nbg".*?title="(?P<name>.*?)">.*?'
r'.*?(?P<year>.*?)\(.*?'
r'.*?(?P<fen>.*?).*?'
r'.*?\((?P<pnum>.*?)人评价',re.S
)
it = obj.finditer(response.text)
with open("movie.csv",mode="w",encoding="utf-8") as f:
cvswriter = csv.writer(f)

for item in it:
dic = item.groupdict()
dic['year']=dic['year'].strip()
cvswriter.writerow(dic.values())

这段代码主要用于从 response.text 中提取特定的信息，并将其写入到一个 CSV 文件中。

首先，通过 re.compile 函数创建了一个正则表达式对象 obj ，该正则表达式用于匹配以下内容：

- <a class="nbg" 标签中 title 属性的值，并将其命名为捕获组 name 。
- 标签中关于人数评价的部分，命名为捕获组 pnum 。

然后，使用 obj.finditer(response.text) 来查找所有匹配的结果，并将结果存储在迭代器 it 中。

接着，使用 with open 语句以写入模式打开一个名为 movie.csv 的文件，并创建一个 csv.writer 对象 cvswriter 。

在循环中，对于每个匹配结果 item ，通过 item.groupdict() 获取捕获组的字典 dic ，并对 dic 中 'year' 的值进行去除两端空白字符的处理。最后，使用 cvswriter.writerow(dic.values()) 将处理后的字典值以一行的形式写入到 CSV 文件中。

青龙摄影

关注

19
点赞
踩
6

收藏

觉得还不错? 一键收藏
打赏
0
评论
如何用正则表达式finditer排行榜数据保存到csv.

在循环中，对于每个匹配结果 item ，通过 item.groupdict() 获取捕获组的字典 dic ，并对 dic 中 'year' 的值进行去除两端空白字符的处理。- <a class="nbg" 标签中 title 属性的值，并将其命名为捕获组 name。- 标签中关于人数评价的部分，命名为捕获组 pnum。- <p class="pl" 标签中的内容，并将其中的一部分命名为捕获组 year。
复制链接

扫一扫