爬取豆瓣音乐 250, python 保存为csv 格式

爬取豆瓣音乐 250, python 保存为csv 格式

import requests
from bs4 import BeautifulSoup
import csv

fp = open('../爬虫/webspider/豆瓣音乐.csv', 'a')
write = csv.writer(fp)
write.writerow(['歌曲名称', '内容', '评分', '评价'])

urls = 
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
好的,我来给你讲一下具体的步骤。 首先,我们需要用Python的requests库和BeautifulSoup库来豆瓣电影TOP250的页面内容。具体代码如下: ```python import requests from bs4 import BeautifulSoup import csv # 发送请求并获页面内容 url = 'https://movie.douban.com/top250' headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'} response = requests.get(url, headers=headers) soup = BeautifulSoup(response.content, 'html.parser') ``` 然后,我们需要用BeautifulSoup库来解析页面内容,并把需要的信息保存到一个列表里。这里我们需要获电影的排名、电影名、评分、评价人数和电影简介。具体代码如下: ```python # 解析页面内容并获需要的信息 movie_list = [] for item in soup.select('.item'): rank = item.select('em')[0].get_text() title = item.select('.title')[0].get_text().split('/')[0].strip() rating = item.select('.rating_num')[0].get_text() rating_num = item.select('.rating_num')[0].find_next_sibling().find_next_sibling().get_text().replace('人评价', '') movie_info = item.select('.bd p')[0].get_text().strip() movie_list.append([rank, title, rating, rating_num, movie_info]) ``` 最后,我们把数据保存csv格式的文件。具体代码如下: ```python # 将数据保存csv格式的文件 with open('douban_top250.csv', 'w', newline='', encoding='utf-8') as f: writer = csv.writer(f) writer.writerow(['排名', '电影名', '评分', '评价人数', '电影简介']) for movie in movie_list: writer.writerow(movie) ``` 这样,我们就完成了Python豆瓣电影TOP250并保存csv的操作。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值