Python制作某火爆游戏资料查询助手

最新推荐文章于 2024-05-13 14:54:22 发布

「已注销」

最新推荐文章于 2024-05-13 14:54:22 发布

阅读量173

点赞数

分类专栏： python 文章标签： python 开发语言

本文链接：https://blog.csdn.net/weixin_62853513/article/details/123697591

版权

python 专栏收录该内容

170 篇文章 8 订阅

订阅专栏

1、我们是不是要去获取这些数据《和平精英》武器配件 (爬虫部分) 首先：对于武器一个详情页url地址发送请求, 获取每个武器的url地址
其次：对于每个武器的url地址发送请求然后获取每个武器的一些基本信息

2、爬虫代码实现思路

发送请求

url 唯一资源定位请求头 headers 字典形式请求体注意点： headers参数问题请求方式：get请求 / post请求
2. 获取数据

遇到到反爬怎么办，遇到加密怎么办：字体加密、JS加密、动态数据网页参数变化怎么找,在哪找
response.text：获取网页的文本数据、字符串 json() ：json字典数据怎么取值? 根据键值对取值 content 状态码

解析数据

方式很多种：

正则表达式 re bs4 xpath parsel (css选择器/xpath)

保存数据 (只要打印输入就可以了)

保存文本保存json 保存数据库：非关系型数据库关系型数据库开始敲代码需要爬取的数据：武器、配件、物资、载具

在这里插入图片描述

在发送请求之前是不是需要加一个请求头
请求头: 把python代码伪装成浏览器对服务器发送一个请求然后服务器就会给我们返回一个response数据
user-agent :浏览器信息

import requests # 第三方模块
 
headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'
}
response = requests.get(url=html_url, headers=headers)

先爬取解析武器的数据，优缺点、武器的伤害都全部爬取下来
在这里插入图片描述

def get_arms_info():
    url = 'https://gp.qq.com/cp/a20190522gamedata/pc_list.shtml'
    response = get_response(html_url=url)
    selector = parsel.Selector(response.text)
    # css选择器 就根据标签属性提取相关内容
    href = selector.css('#section-container .clear li a::attr(href)').getall()
    titles = selector.css('#section-container .clear li a::attr(title)').getall()
    # 通常我们要获取一个列表里面 每个元素 是不是要通过遍历 for循环
    zip_data = zip(href, titles)
    lis = []
    for index in zip_data:
        dit = {
            '物品名称': index[1],
            '详情页': index[0]
        }
        lis.append(dit)
    pd_data = pd.DataFrame(lis)
    pd.set_option('display.max_columns', None)
    print(pd_data)
    arms_num = input('请输入你要查询的武器序号: ')
    if int(arms_num) <= len(lis):
        arms_url = lis[int(arms_num)]['详情页']
        response_1 = get_response(arms_url)
        selector_1 = parsel.Selector(response_1.text)
        kind = selector_1.css('.wea_class::text').get() # 武器种类
        bullet = selector_1.css('.wea_bullet::text').get() # 子弹口径
        skin_list = selector_1.css('.parts_list li .skin_name::text').getall() # 子弹口径
        # 把列表转成我们字符串类型
        skin_name = '/'.join(skin_list)
        advantage = selector_1.css('.merit_text p:nth-child(2)::text').get()
        defect = selector_1.css('.merit_text p:nth-child(4)::text').get()
        st_hurt = selector_1.css('.merit_rt_st li::text').getall()
        tb_hurt = selector_1.css('.merit_rt_tb li::text').getall()
        print('--'*50)
        print('武器名字: ', lis[int(arms_num)]['物品名称'])
        print('武器的类型: ', kind)
        print('子弹', bullet)
        print('最佳配件: ', skin_name)
        print('优点: ', advantage)
        print('缺点: ', defect)
        print('--'*50)
        print('武器击中身体伤害：')
        print(f'裸装击中身体：{st_hurt[0]}枪淘汰')
        print(f'一级甲击中身体：{st_hurt[1]}枪淘汰')
        print(f'二级甲击中身体：{st_hurt[2]}枪淘汰')
        print(f'三级甲击中身体：{st_hurt[3]}枪淘汰')
        print('--' * 50)
        print('武器击中头部伤害：')
        print(f'裸装击中头部：{tb_hurt[0]}枪淘汰')
        print(f'一级头击中头部：{tb_hurt[1]}枪淘汰')
        print(f'二级头击中头部：{tb_hurt[2]}枪淘汰')
        print(f'三级头击中头部：{tb_hurt[3]}枪淘汰')
        print('--' * 50)
    else:
        print('输入有误')

配件的数据解析
在这里插入图片描述

def get_fitting_info():
    """配件"""
    html_url = 'https://gp.qq.com/cp/a20190522gamedata/pc_list.shtml'
    response = get_response(html_url)
    selector = parsel.Selector(response.text)
    titles = selector.css('#section-container2 .clear li a::attr(title)').getall()
    href = selector.css('#section-container2 .clear li a::attr(href)').getall()
    zip_data_1 = zip(titles, href)
    lis = []
    for index in zip_data_1:
        title = index[0]
        index_url = index[1]
        dit = {
            '物品名称': title,
            '详情页': index_url,
        }
        lis.append(dit)
    pd_data = pd.DataFrame(lis)
    pd.set_option('display.max_columns', None)
    print('配件分类如下所示：')
    print(pd_data)
    fitting_num = input('请输入你要查询的配件序号：')
    fitting_url = lis[int(fitting_num)]['详情页']
    html_data = get_response(fitting_url).text
    sel = parsel.Selector(html_data)
    fitting_sx = sel.css('.intro_sx dd::text').get()
    fitting_sy = sel.css('.intro_sy dd::text').get()
    print('--' * 50)
    print('配件名字：', lis[int(fitting_num)]['物品名称'])
    print('配件属性：', fitting_sx)
    print('配件适用：', fitting_sy)
    print('--' * 50)

物资的数据解析
在这里插入图片描述

def get_supplies_info():
    """物资"""
    html_url = 'https://gp.qq.com/cp/a20190522gamedata/pc_list.shtml'
    response = get_response(html_url)
    selector = parsel.Selector(response.text)
    titles = selector.css('#section-container3 .clear li a::attr(title)').getall()
    href = selector.css('#section-container3 .clear li a::attr(href)').getall()
    zip_data_2 = zip(titles, href)
    lis = []
    for index in zip_data_2:
        title = index[0]
        index_url = index[1]
        dit = {
            '物品名称': title,
            '详情页': index_url,
        }
        lis.append(dit)
    pd_data = pd.DataFrame(lis)
    pd.set_option('display.max_columns', None)
    print('物资分类如下所示：')
    print(pd_data)
    supplies_num = input('请输入你要查询的物资序号：')
    supplies_url = lis[int(supplies_num)]['详情页']
    html_data = get_response(supplies_url).text
    sel = parsel.Selector(html_data)
    supplies_sx = sel.css('.intro_sx dd::text').get()
    print('--' * 50)
    print('配件名字：', lis[int(supplies_num)]['物品名称'])
    print('配件属性：', supplies_sx)
    print('--' * 50)

载具的数据解析

在这里插入图片描述

def get_car_info():
    """载具"""
    html_url = 'https://gp.qq.com/cp/a20190522gamedata/pc_list.shtml'
    response = get_response(html_url)
    selector = parsel.Selector(response.text)
    titles = selector.css('#section-container4 .clear li a::attr(title)').getall()
    href = selector.css('#section-container4 .clear li a::attr(href)').getall()
    zip_data_2 = zip(titles, href)
    lis = []
    for index in zip_data_2:
        title = index[0]
        index_url = index[1]
        dit = {
            '物品名称': title,
            '详情页': index_url,
        }
        lis.append(dit)
    pd_data = pd.DataFrame(lis)
    pd.set_option('display.max_columns', None)
    print('物资分类如下所示：')
    print(pd_data)
    supplies_num = input('请输入你要查询的物资序号：')
    supplies_url = lis[int(supplies_num)]['详情页']
    html_data = get_response(supplies_url).text
    sel = parsel.Selector(html_data)
    supplies_sx = sel.css('.intro_sx dd::text').get()
    print('--' * 50)
    print('配件名字：', lis[int(supplies_num)]['物品名称'])
    print('配件属性：', supplies_sx)
    print('--' * 50)

调用函数，判断

if __name__ == '__main__':
    while True:
        string = """===================================
            和平精英资料查询助手V1.0版本
            0.武器 1.配件 2.物资 3.载具
==================================="""
        print(string)
        word = input('请输入你要查询的内容(输入n退出): ')
        if word == '0':
            get_arms_info()
        elif word == '1':
            get_fitting_info()
        elif word == '2':
            get_supplies_info()
        elif word == '3':
            get_car_info()
        elif word == 'n':
            break
        else:
            print('请正确输入~~')

「已注销」

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Python制作某火爆游戏资料查询助手

1、我们是不是要去获取这些数据《和平精英》武器配件 (爬虫部分) 首先：对于武器一个详情页url地址发送请求, 获取每个武器的url地址其次：对于每个武器的url地址发送请求然后获取每个武器的一些基本信息2、爬虫代码实现思路发送请求url 唯一资源定位请求头 headers 字典形式请求体注意点： headers参数问题请求方式：get请求 / post请求2. 获取数据遇到到反爬怎么办，遇到加密怎么办：字体加密、JS加密、动态数据网页参数变化怎么找,在哪找resp.
复制链接

扫一扫