等等 python 爬虫

最新推荐文章于 2024-08-10 23:14:03 发布

DDTT工作室

最新推荐文章于 2024-08-10 23:14:03 发布

阅读量315

点赞数

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/u011811877/article/details/50946247

版权

python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

# 匹配评论
pattern6 = re.compile('<div id="review_.*?" class="reviewSelector.*?', re.S)
# 获得所有的评论
items6 = re.findall(pattern6, html)
# 遍历分析每一个评论内容
for item in items6:
# 获取用户的主页地址 http://www.tripadvisor.cn/members/打头
p6_user_url ='href="members/(.*?)"'
user_url = re.search().group()
print(user_url)
# 评论标题
p6_rv_title = '(.*?)'
rv_title = re.search().group()
# 评分
p6_rv_rate = '<img class="sprite-rating_s_fill.*?alt=[0-9]分'
rv_rate = re.search().group()
# 发表时间
p6_rv_time = '(.*?)'
rv_time = re.search().group()
# 评论内容
p6_rv_content = '(.*?)'
rv_content = re.search().group()