用python爬网站评论_python爬取携程景点评论信息

最新推荐文章于 2022-10-10 11:48:48 发布

weixin_39654352

最新推荐文章于 2022-10-10 11:48:48 发布

阅读量391

点赞数

文章标签：用python爬网站评论

本文介绍如何使用Python的requests库以POST方式爬取携程网上特定景点的用户评论数据。通过对网页结构的分析，确定了请求所需的参数，并展示了如何构造正确的请求数据来获取JSON格式的评论信息。

摘要由CSDN通过智能技术生成

今天要分析的网站是携程网，获取景点的用户评论，评论信息通过json返回API，页面是这个样子的

按下F12之后，F5刷新一下

具体需要URL

Request的方式为POST，还需要你提取的哪一页，下面图片显示了页面id，景点id(viewid),pagenum页面数，pagesize页面的项数等等。

最基本的GET请求可以直接用post方法

response = requests.post("http://www.baidu.com/", data = data)

对于 POST 请求来说，我们一般需要为它增加一些参数。那么最基本的传参方法可以利用 data 这个参数。

data={

"pageid": "10650000804",

"viewid": 107540,

"tagid": "0",

"pagenum": "1",

"pagesize": "50",

"contentType": "json",

"SortType":"1",

"head": {

"appid": "100013776",

"cid": "09031037211035410190",

"ctok": "",

"cver": "1.0",

"lang": "01",

"sid": "8888",

"syscode": "09",

"auth": "",

"extension": [

{

"name": "protocal",

"value": "https"

}

]

"ver": "7.10.3.0319180000"

}

因此

html=requests.post(URL,data=json.dumps(data)).text

html=json.loads(html)

部分结果如下

处理json文件后可以得到如下结果

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39654352

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python爬取携程和同程的景点评论并实现词云

sandy_star

12-08

6075

某人为了期末作业（非计算机系的文科生）想获取数据做分析，奈何不会八爪鱼，于是乎她成了我的甲方。甲方妈妈的需求是这样的：爬取携程网和同程网的对于三亚蜈支洲岛的评论。一、爬取携程网的评论 1.1 分析爬取的地址：https://you.ctrip.com/sight/sanya61/3244.html#comment 评论在这里，并且有分页但是发现点击下一页的时候地址栏并没有变化所以这种情况打开F12控制台看看吧发现分页和这个响应有关，并且返回的是一个json数据的格式 .

python爬虫携程酒店_携程酒店爬取分享

weixin_39921504的博客

12-22

1560

该楼层疑似违规已被系统折叠隐藏此楼查看此楼import urllib.requestfrom bs4 import BeautifulSoupimport csvimport redef openlink(link):maxTryNum=20for tries in range(maxTryNum):try:response = urllib.request.urlopen(link).read...

参与评论您还未登录，请先登录后发表或查看评论

python网络爬虫获取景点信息源码

09-20

python网络爬虫获取去哪儿网景点信息源码，获取的景点信息有'景点', '景点类别', '景点级别', '地点', '经度', '纬度', '开放时间', '景点介绍', '评论次数', '游客评分', '热度', '关键词', '图片路径'。内有详细注释。

Python-爬取携程景点信息

m0_46639364的博客

09-27

9266

携程在手说走就走。今天来记录一下爬取携程旅行的教程。首先告诉大家，爬携程还是相对简单的，当然也有难得方法，这里就以实现为最终目标讲解最简单得方法。我要采集得是携程门票一栏得景点信息。还是照惯例用chrome抓包。首先需要获取每个景点详情页的url，我这边找到了直接贴图。原来以为拿到这个页面问题就解决了，可实践发现事情并没有我想的那么简单，这是一个post请求。我把参数都带上进行访问，压根拿不到数据。返回的json文件是这样的。研究了一下，发现参数里有一个变动的加密参数‘traceid’，很明显

python爬取携程评论

Li12139的博客

01-26

2007

import requests import json import time pagesize=300 headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.71 Safari/537.36', } posturl = "https://m.ctrip.com/restapi/soa2/13444/j.

Python-XiechengComment多线程Threading爬取携程的丽江古城景点评论并生成词云

08-10

Xiecheng_Comment多线程Threading爬取携程的丽江古城景点评论并生成词云

基于python实现爬取携程景点数据与评论数据源码+项目说明.zip

08-10

【资源说明】基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 基于python实现爬取携程景点数据与评论数据源码+项目说明.zip 1、该资源内项目代码都是经过测试运行成功，功能ok的情况下才上传的，请放心下载使用！ 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载使用，也适合小白学习进阶，当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行，也可在此代码基础上进行修改，以实现其他功能。爬取结果有两部分：`data/poi.csv`为**景点数据**，`data/comment/{id}.csv`为对应ID的景点的**评论数据** 评论内容的爬取有两种方法：将`config.ini`中的`isCrawlComment`置为1，运行`poi_crawl.py`文件，在爬取景点数据的过程中爬取评论数据将`config.ini`中的`isCrawlComment`置为0，运行`poi_crawl.py`文件，在爬取景点数据结束后运行再运行`comment_crawl.py`文件，获取景点数据中的所有景点的评论每次运行前都会在同一文件夹下复制一份上一次爬取的景点结果的备份，名为`back.csv` 数据中 **价格**、**最低价格**为response中的数据，暂无参考价值后面四种人群门票价格为**预估的销量加权平均价格**，如果有不同需求可以修改 `GetTicketPrice` 函数。（返回的数据为所有的门票价格）景点数据中的**开放时间**与**优惠政策** 数据的格式为json格式爬取的评论数据格式为： **用户ID** **评论文本** **发送时间戳** **赞同数**

python爬取携程网评论.zip

11-10

总结起来，"python爬取携程网评论.zip"项目涵盖了Python网络爬虫的基本流程：发送HTTP请求获取网页，解析HTML提取所需信息，处理分页，数据清洗与存储。这个过程既锻炼了Python编程技能，也提升了数据分析的能力，是...

毕业设计-基于python实现的爬取携程景点数据和评论数据+源代码+文档说明.zip

最新发布

09-01

python爬取携程景点_python爬取携程景点评论信息

weixin_39637975的博客

12-10

853

今天要分析的网站是携程网，获取景点的用户评论，评论信息通过json返回API，页面是这个样子的按下F12之后，F5刷新一下具体需要URLRequest的方式为POST，还需要你提取的哪一页，下面图片显示了页面id，景点id(viewid),pagenum页面数，pagesize页面的项数等等。最基本的GET请求可以直接用post方法response = requests.post("http://...

携程在线评论爬虫

04-12

使用模拟浏览器方法爬取携程网的在线评论，header自行添加

大数据专题-spark mysql python爬虫携程景点爬取（含虚拟机镜像）

欧阳小白闯天涯

10-10

1620

使用spark读取csv文件数据并分析数据。使用spark将csv文件数据导入到mysql中。使用sql查找数据库数据。构建echarts框架的图表页面。使用spark将分析的json数据输出。使用eharts前端页面分析json数据进行展示。

python携程酒店评论_python爬携程酒店评论，携程酒店评论爬虫

weixin_39934257的博客

12-05

887

# -*- coding: utf-8 -*-import scrapyimport PyV8import csvimport reimport mathimport timeimport redisimport requestsimport hashlibimport randomuas=["Mozilla/5.0 (Linux; U; Android 5.0.2; zh-CN; Letv X5...

python爬取携程酒店评论_python爬取携程酒店列表

weixin_28622215的博客

02-04

1834

做个笔记，亲测可用```pythonimport requestsimport jsonfrom lxml import etreefrom bs4 import BeautifulSoupurl = 'https://m.ctrip.com/webapp/hotel/j/hotellistbody?pageid=212093&key=a618c%60iDcf8%C2%A814KGaa03...

python+selenium+BeautifulSoup爬取酒店评论

keaideciel的博客

03-28

671

python爬取python爬取新的改变功能快捷键合理的创建标题，有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants创建一个自定义列表如何创建一个注脚注释也是必不可少的KaTeX数学公式新的甘特图功能，丰富你的文章UML 图表FLowchart流程图导出与导入导出导入 python爬取你好！这是你第一次使用 Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读

【python爬虫】爬取agoda酒店评论数据

weixin_42108731的博客

05-24

1631

人的生活一般离不开衣食住行，今天就来扒一扒酒店评论数据，看看大家都喜欢住什么酒店？住哪家酒店性价比高？一、打开agoda官网，找到想要了解的城市对应的酒店列表，以广州为例：二、找到其中一家酒店，获取酒店ID：三、进入酒店详情页，找到酒店评论：四、对评论数据进行采集：以上就是我的分享，如果有什么不足之处请指出，多交流，谢谢！如果喜欢，请关注我。想获取更多数据或定制爬虫的请点击python爬虫专业定制 ...

携程旅游网与马蜂窝游客记录爬取

阿优乐扬的博客

10-24

8106

前言：这是我学习Python爬虫以来，第一次使用python进行大规模的进行数据挖掘。邀请我加入她们科研项目的是工商学院的彭老师，做一个关于避暑旅游的课题。当他们需要获取携程旅游笔记时，由于文章的内容太多，思路也没有考虑好，无法使用数据采集器把笔记放入Excel。于是找到了我们信息学院寻求方法帮助，我的辅导员老师就向她推荐了我。终于有机会进行大型的项目实战了，非常幸运能参与这次的项目。但也由于平...

python携程酒店评论_Python基于selenium爬取携程酒店评论信息

weixin_39628070的博客

12-05

832

爬取站点任意一个携程酒店的详细链接，这里给出了四个，准备开四个线程爬取：https://hotels.ctrip.com/hotel/6278770.html#ctm_ref=hod_hp_hot_dl_n_2_7https://hotels.ctrip.com/hotel/6657909.html#ctm_ref=hod_hp_hot_dl_n_2_8https://hotels.ctrip.c...

Python爬虫——aiohttp异步协程爬取同程旅行酒店评论

霖hero

11-12

1672

大家好！我是霖hero Python并发编程有三种方式：多线程(Threading)、多进程(Process)、协程(Coroutine)，使用并发编程会大大提高程序的效率，今天我们将学习如何选择多线程、多进程和协程来提高代码的效率、如何使用异步协程，并用协程来获取同程旅行酒店的评论数据。目录并发编程多线程（Threading）多进程(Process) 协程(Coroutine) 并发编程对比异步协程 asyncio模块 aiohttp库 aiohttp基本使用 post请