黄鹤楼

  《黄鹤楼》
作家/罗光记
黄鹤高楼耸碧空,江流环绕似画中。
千年古迹凭谁守,唯有清风与我共。
月照楼台影独长,烟波浩渺思茫茫。
黄鹤一去不复返,空余楼阁锁斜阳。
谁言往事成云烟,只留青石诉千年。
凭栏远望天涯尽,心随江水去无边。
繁星点点映江流,楼阁巍巍接天秋。
黄鹤曾留千载梦,如今只余月明楼。
鹤归之日我重游,黄鹤楼前泪满眸。
历史沧桑皆成梦,唯有高楼立不倒。

引用: python爬取携程景区用户评论(爬虫时遇到翻页但url不变问题时的解决办法) python爬取携程景区用户评论Ajax页面加载的页面和普通页面的不同解决办法效果。引用[2]:前两天想要爬取携程网上景区的用户评论,但是却发现用户评论在翻页时,网页的url却不变,这就造成我们无法用简单的request.get()访问其他页面获取内容了。经过查阅资料发现这是一个通过Ajax页面加载的页面。具体Ajax页面加载的页面是什么这里不加以解释,本文只关于如何爬取这样的网站。本文以黄鹤楼景区为例。携程网黄鹤楼景区链接 Ajax页面加载的页面和普通页面的不同。 要爬取携程游客评论黄鹤楼,你可以使用Python编写一个爬虫程序。首先,你需要确定黄鹤楼景区的携程网址。然后,你可以使用Python的requests库来发送GET请求,并使用BeautifulSoup库来解析网页内容。根据你提供的引用,黄鹤楼的用户评论是通过Ajax页面加载的,这意味着评论内容可能不会直接显示在初始加载的网页上。 为了获取所有评论,你需要模拟浏览器中的请求,通过发送POST请求来触发加载更多评论的操作。你可以在开发者工具中查找到相应的网址和请求参数。使用requests库发送POST请求,并将参数传递给它,以获取新加载的评论。 当你成功获取到所有评论后,你可以使用正则表达式或BeautifulSoup库来提取评论的具体内容。根据页面的结构,你可以使用标签、class、id等属性来定位评论所在的HTML元素,并提取出评论文本。 以下是一个简单的示例代码,展示了如何爬取携程游客评论黄鹤楼的部分内容: ```python import requests from bs4 import BeautifulSoup url = "https://xxx" # 替换为黄鹤楼携程网址 # 发送GET请求获取初始网页内容 response = requests.get(url) html = response.text # 解析网页内容 soup = BeautifulSoup(html, "html.parser") # 提取评论内容 comments = soup.find_all("div", class_="comment-text") # 替换为具体的评论内容标签和属性 for comment in comments: print(comment.text.strip()) # 输出评论文本 # 发送POST请求获取更多评论 # ... ``` 这是一个基本的示例,你可以根据实际情况进行调整和完善。请注意,具体的网页结构和加载方式可能因网站的更新而有所变化,你需要根据实际情况进行修改。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值