春节快到了,又要到一年中紧张刺激的时候了!
买票回家!
今天教大家想做一个简单好用的查票系统!
本次用到环境和模块
环境:
- Python 3.6
- Pycharm
模块
- requests
- pandas
- json
模块在cmd里pip install +模块名 就可以安装好了
基本思路:
一. 这些数据内容是从哪里的?
通过开发者工具进行抓包分析, 分析具体的数据是从哪里的
可以通过用搜索 你想要数据内容, 会给你返回相应的数据
二. 代码实现步骤
确定需求 >>> 发送请求 >>> 获取数据 >>> 解析数据 >>> 保存数据
- 发送请求, 对于相应的数据包url地址发送请求
- 获取数据, 获取响应体json字典数据
- 解析数据, 直接通过键值对提取数据
- 数据展示
代码
import requests # 数据请求模块 pip install requests
import pprint # 格式化输出的模块
import pandas as pd # pip install pandas
import json
f = open('city.json', mode='r', encoding='utf-8')
text = f.read()
city_json = json.loads(text)
# dit = dict(text)
# <class 'str'> 字符串转字典 json
while True:
from_station = input('请输入出发的城市: ')
to_station = input('请输入目的城市: ')
# date = input('请输入查询时间(格式: 2021-09-10): ')
# print(city_json[from_station])
# print(city_json[to_station])
# print(type(city_json))
# 模块安装
# win + R 输入cmd pip install requests
# 发送请求
# url = 'https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2021-09-11&leftTicketDTO.from_station=CSQ&leftTicketDTO.to_station=LZZ&purpose_codes=ADULT'
url = 'https://kyfw.12306.cn/otn/leftTicket/query'
# 字典的形式 ? 非贪婪匹配
data = {
'leftTicketDTO.train_date': '2021-09-11',
'leftTicketDTO.from_station': city_json[from_station],
'leftTicketDTO.to_station': city_json[to_station],
'purpose_codes': 'ADULT',
}
# 请求头是什么? 作用是什么? 为什么要加
# 作用是什么 伪装浏览器 (把python代码伪装成浏览器对于发送请求)
# headers User-Agent: 浏览器基本信息
# Cookie 用户信息 host 域名 referer 防盗链
# 比如 笔趣阁 表情包网站 你都可以不加headers (对某些网站)
headers = {
'Cookie': '*',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/93.0.4577.63 Safari/537.36'
}
# <Response [200]> 返回的是响应体对象 <> 表示对象 200[状态码]表示请求成功
# 请求参数 params: get请求传递的请求参数 data: post请求需要提交表单
response = requests.get(url=url, params=data, headers=headers)
response.encoding = response.apparent_encoding
# 如果服务器给我们返回的响应体数据 {} 完整的 可以直接获取json字典数据
# result = response.json()['data']['result']
# pprint.pprint(response.json())
# print(response.text)
# 解析数据 根据键值对进行取值 根据冒号左边的内容 提取冒号右边的内容
# json 和 字典 数据类型是一样的 json是一种数据存储的格式
result = response.json()['data']['result']
lis = []
for index in result[1:]:
# 字符串分割方法
index_list = index.replace('有', 'Yes').replace('无', 'No').split('|') # 返回的列表 可以根据索引位置提取内容
page = 0
Num = index_list[3] # 车次
time_1 = index_list[8] # 发车时间
time_2 = index_list[9] # 到达时间
prince_seat = index_list[32] # 特等座
first_class_seat = index_list[31] # 一等座
second_class = index_list[30] # 二等座
Wz = index_list[26] # 无座
Yz = index_list[29] # 硬座
Rw = index_list[23] # 软卧
Yw = index_list[28] # 硬卧
dit = {
'Num': Num,
'Start': time_1,
'End': time_2,
'Top':prince_seat,
'First':first_class_seat,
'Second':second_class,
'Wz': Wz,
'Yz': Yz,
'Rw': Rw,
'Yw': Yw,
}
lis.append(dit)
# print(dit)
pd.set_option('display.max_rows', None)
columns = ['Num', 'Start', 'End', 'Top', 'First', 'Second', 'Yz', 'Wz', 'Rw', 'Yw']
content = pd.DataFrame(lis, columns=columns)
print(content)
实现效果:
喜欢记得点赞评论哦!
结尾给大家推荐一个非常好的学习教程,希望对你学习Python有帮助!
Python基础入门教程推荐:←点击左边蓝色文字就可以跳转观看了
Python爬虫案例教程推荐:←点击左边蓝色文字就可以跳转观看了