python爬取《你好, 李焕英》豆瓣评论数据

最新推荐文章于 2024-02-18 21:08:32 发布

python技巧(数据分析及可视化)

最新推荐文章于 2024-02-18 21:08:32 发布

阅读量3.3k

点赞数 6

分类专栏：网络爬虫

本文链接：https://blog.csdn.net/muyashui/article/details/114298666

版权

# 导入工具包
import requests
from bs4 import BeautifulSoup
import time
import pandas as pd
import numpy as np

# 请求头
headers={
   'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.190 Safari/537.36'}
# =============================================================================
# 爬取一页
# =============================================================================
# 爬取的网址
url='https://movie.douban.com/subject/34841067/comments?limit=20&status=P&sort=new_score'

# 获取信息
html = requests.get(url,headers=headers)
# 获取内容
data = html.text
soup = BeautifulSoup(data,'lxml')

# 信息
# 用户
names = soup.select('#comments > div > div.comment > h3 > span.comm