Python制作某火爆游戏资料查询助手

1、我们是不是要去获取这些数据《和平精英》武器配件 (爬虫部分) 首先:对于 武器一个详情页url地址发送请求, 获取 每个武器的url地址
其次:对于 每个武器的url地址发送请求 然后获取每个武器的一些基本信息

2、爬虫代码实现思路

  1. 发送请求

url 唯一资源定位 请求头 headers 字典形式 请求体 注意点: headers参数问题 请求方式:get请求 / post请求
2. 获取数据

遇到到反爬怎么办,遇到加密怎么办: 字体加密、JS加密、动态数据网页参数变化怎么找,在哪找
response.text:获取网页的文本数据、字符串 json() :json字典数据怎么取值? 根据键值对取值 content 状态码

  1. 解析数据

方式很多种:

正则表达式 re bs4 xpath parsel (css选择器/xpath)

  1. 保存数据 (只要打印输入就可以了)

保存文本 保存json 保存数据库: 非关系型数据库 关系型数据库 开始敲代码 需要爬取的数据:武器、配件、物资、载具

在这里插入图片描述
在这里插入图片描述

在发送请求之前是不是需要加一个请求头
请求头: 把python代码伪装成浏览器对服务器发送一个请求 然后服务器就会给我们返回一个response数据
user-agent :浏览器信息

import requests # 第三方模块
 
headers = {
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/90.0.4430.93 Safari/537.36'
}
response = requests.get(url=html_url, headers=headers)

先爬取解析武器的数据,优缺点、武器的伤害都全部爬取下来
在这里插入图片描述

def get_arms_info():
    url = 'https://gp.qq.com/cp/a20190522gamedata/pc_list.shtml'
    response = get_response(html_url=url)
    selector = parsel.Selector(response.text)
    # css选择器 就根据标签属性提取相关内容
    href = selector.css('#section-container .clear li a::attr(href)').getall()
    titles = selector.css('#section-container .clear li a::attr(title)').getall()
    # 通常我们要获取一个列表里面 每个元素 是不是要通过遍历 for循环
    zip_data = zip(href, titles)
    lis = []
    for index in zip_data:
        dit = {
            '物品名称': index[1],
            '详情页': index[0]
        }
        lis.append(dit)
    pd_data = pd.DataFrame(lis)
    pd.set_option('display.max_columns', None)
    print(pd_data)
    arms_num = input('请输入你要查询的武器序号: ')
    if int(arms_num) <= len(lis):
        arms_url = lis[int(arms_num)]['详情页']
        response_1 = get_response(arms_url)
        selector_1 = parsel.Selector(response_1.text)
        kind = selector_1.css('.wea_class::text').get() # 武器种类
        bullet = selector_1.css('.wea_bullet::text').get() # 子弹口径
        skin_list = selector_1.css('.parts_list li .skin_name::text').getall() # 子弹口径
        # 把列表转成我们字符串类型
        skin_name = '/'.join(skin_list)
        advantage = selector_1.css('.merit_text p:nth-child(2)::text').get()
        defect = selector_1.css('.merit_text p:nth-child(4)::text').get()
        st_hurt = selector_1.css('.merit_rt_st li::text').getall()
        tb_hurt = selector_1.css('.merit_rt_tb li::text').getall()
        print('--'*50)
        print('武器名字: ', lis[int(arms_num)]['物品名称'])
        print('武器的类型: ', kind)
        print('子弹', bullet)
        print('最佳配件: ', skin_name)
        print('优点: ', advantage)
        print('缺点: ', defect)
        print('--'*50)
        print('武器击中身体伤害:')
        print(f'裸装击中身体:{st_hurt[0]}枪淘汰')
        print(f'一级甲击中身体:{st_hurt[1]}枪淘汰')
        print(f'二级甲击中身体:{st_hurt[2]}枪淘汰')
        print(f'三级甲击中身体:{st_hurt[3]}枪淘汰')
        print('--' * 50)
        print('武器击中头部伤害:')
        print(f'裸装击中头部:{tb_hurt[0]}枪淘汰')
        print(f'一级头击中头部:{tb_hurt[1]}枪淘汰')
        print(f'二级头击中头部:{tb_hurt[2]}枪淘汰')
        print(f'三级头击中头部:{tb_hurt[3]}枪淘汰')
        print('--' * 50)
    else:
        print('输入有误')

配件的数据解析
在这里插入图片描述

def get_fitting_info():
    """配件"""
    html_url = 'https://gp.qq.com/cp/a20190522gamedata/pc_list.shtml'
    response = get_response(html_url)
    selector = parsel.Selector(response.text)
    titles = selector.css('#section-container2 .clear li a::attr(title)').getall()
    href = selector.css('#section-container2 .clear li a::attr(href)').getall()
    zip_data_1 = zip(titles, href)
    lis = []
    for index in zip_data_1:
        title = index[0]
        index_url = index[1]
        dit = {
            '物品名称': title,
            '详情页': index_url,
        }
        lis.append(dit)
    pd_data = pd.DataFrame(lis)
    pd.set_option('display.max_columns', None)
    print('配件分类如下所示:')
    print(pd_data)
    fitting_num = input('请输入你要查询的配件序号:')
    fitting_url = lis[int(fitting_num)]['详情页']
    html_data = get_response(fitting_url).text
    sel = parsel.Selector(html_data)
    fitting_sx = sel.css('.intro_sx dd::text').get()
    fitting_sy = sel.css('.intro_sy dd::text').get()
    print('--' * 50)
    print('配件名字:', lis[int(fitting_num)]['物品名称'])
    print('配件属性:', fitting_sx)
    print('配件适用:', fitting_sy)
    print('--' * 50)

物资的数据解析
在这里插入图片描述

def get_supplies_info():
    """物资"""
    html_url = 'https://gp.qq.com/cp/a20190522gamedata/pc_list.shtml'
    response = get_response(html_url)
    selector = parsel.Selector(response.text)
    titles = selector.css('#section-container3 .clear li a::attr(title)').getall()
    href = selector.css('#section-container3 .clear li a::attr(href)').getall()
    zip_data_2 = zip(titles, href)
    lis = []
    for index in zip_data_2:
        title = index[0]
        index_url = index[1]
        dit = {
            '物品名称': title,
            '详情页': index_url,
        }
        lis.append(dit)
    pd_data = pd.DataFrame(lis)
    pd.set_option('display.max_columns', None)
    print('物资分类如下所示:')
    print(pd_data)
    supplies_num = input('请输入你要查询的物资序号:')
    supplies_url = lis[int(supplies_num)]['详情页']
    html_data = get_response(supplies_url).text
    sel = parsel.Selector(html_data)
    supplies_sx = sel.css('.intro_sx dd::text').get()
    print('--' * 50)
    print('配件名字:', lis[int(supplies_num)]['物品名称'])
    print('配件属性:', supplies_sx)
    print('--' * 50)

载具的数据解析

在这里插入图片描述

def get_car_info():
    """载具"""
    html_url = 'https://gp.qq.com/cp/a20190522gamedata/pc_list.shtml'
    response = get_response(html_url)
    selector = parsel.Selector(response.text)
    titles = selector.css('#section-container4 .clear li a::attr(title)').getall()
    href = selector.css('#section-container4 .clear li a::attr(href)').getall()
    zip_data_2 = zip(titles, href)
    lis = []
    for index in zip_data_2:
        title = index[0]
        index_url = index[1]
        dit = {
            '物品名称': title,
            '详情页': index_url,
        }
        lis.append(dit)
    pd_data = pd.DataFrame(lis)
    pd.set_option('display.max_columns', None)
    print('物资分类如下所示:')
    print(pd_data)
    supplies_num = input('请输入你要查询的物资序号:')
    supplies_url = lis[int(supplies_num)]['详情页']
    html_data = get_response(supplies_url).text
    sel = parsel.Selector(html_data)
    supplies_sx = sel.css('.intro_sx dd::text').get()
    print('--' * 50)
    print('配件名字:', lis[int(supplies_num)]['物品名称'])
    print('配件属性:', supplies_sx)
    print('--' * 50)

调用函数,判断

if __name__ == '__main__':
    while True:
        string = """===================================
            和平精英资料查询助手V1.0版本
            0.武器 1.配件 2.物资 3.载具
==================================="""
        print(string)
        word = input('请输入你要查询的内容(输入n退出): ')
        if word == '0':
            get_arms_info()
        elif word == '1':
            get_fitting_info()
        elif word == '2':
            get_supplies_info()
        elif word == '3':
            get_car_info()
        elif word == 'n':
            break
        else:
            print('请正确输入~~')
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
和平之翼代码生成器SHC Swing单机版 本软件是可执行jar,在装好jre或jdk的计算机上只需双击,就能运行。当然,您也可以在命令窗口中以java -jarPeaceWingSHC_Swing_0_8_update1.jar )运行。 本软件的最大亮点是实现了SGS语法加亮的编辑器,并把界面由工作组的Web界面换成了单机版的Swing界面。 生成器的语法特性和生成物的技术对应于和平之翼代码生成器SHC版 0.7.11 以下是部分的Readme =========和平之翼代码生成器的介绍目标和景愿=========== 和平之翼代码生成器是无垠式代码生成器的第二代,轻量级定制版的代码生成器。 他有如下的特点 1)每个版本都是单一技术栈支持。分为不同版本。本版是SpingMVC Spring Hibernate Criteria技术栈。 2)比无垠式代码生成器更美观的弹性界面。 3)比无垠式代码生成器更快的迭代周期。 4)神秘礼物。 5)代码生成器的界面美化。 6)作者电子邮件:[email protected] ==============PeaceWingSHC_Swing 0.8========== 1)将Web版本的PeaceWingSHC 0.7.11移植到单机Swing版本 2)新增生成器的Swing界面 3)为SGS(标准生成器脚本)新增语法加亮的编辑器 4)为SGS编辑器增加新增,保存等编辑器功能 5)生成器引擎的修错和改进 ==============PeaceWingSHC 0.7.11============== 1)将生成器改进到无垠式代码生成器0.8的水平 2)增加ActiveField名为deleted或delete自动反义功能 3)增加对DomainID为int类型的支持 4)修改了数据库生成器 5)修复Boolean转换字符串“false”被视为true的Bug

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值