爬取小熊汽车油耗

首先获取各车型的网址

from urllib import request
from bs4 import BeautifulSoup as bs
import re
import pandas as pd


headers = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}
url = "https://www.xiaoxiongyouhao.com/chxi_report_list.php"
req = request.Request(url=url, headers=headers)
res = request.urlopen(req)
print(res.status)
html_data = res.read().decode("utf-8")
Soup = bs(html_data, "html.parser")

p = Soup.find_all("a", target="_blank")
p_str = str(p)
pattern = re.compile(r'/.+?html')            # ? 非贪婪模式
address = re.findall(pattern, p_str)
address_list = []
for i in address:
    temp = "https://www.xiaoxiongyouhao.com" + i[14:]
    address_list.append(temp)

pattern = re.compile(r'>.+?</a>')
car_temp = re.findall(pattern, p_str)
car_list = []
for i in range(len(car_temp)-1):
    temp = car_temp[i][1:-4]
    car_list.append(temp)

temp_df = {"carType":car_list,
           "address":address_list}
df = pd.DataFrame(temp_df)
print(df)
df.to_excel("carList.xls", index=False, encoding="utf-8")
df.to_csv("carList.txt", index=False)

提取各车型网址数据

from urllib import request
from bs4 import BeautifulSoup as bs
import re
import pandas as pd


address_df = pd.read_csv("carList.txt")
df = {"car_type": [],
                   "diaplacement": [],
                   "gearbox": [],
                   "engine": [],
                   "engine_type": [],
                   "fuel_consumption": [],
                   "fuel_consumption_range": [],
                   "owner_quantity": []}
df = pd.DataFrame(df)

for i in range(len(address_df)):
    car = address_df["carType"][i]
    url = address_df["address"][i]

    try:
        headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}
        req = request.Request(url=url, headers=headers)
        res = request.urlopen(req)
        print(i,"/",len(address_df),":",res.status)
        html_data = res.read().decode("utf-8")
        Soup = bs(html_data, "html.parser")
        p = Soup.find("tbody")
        p_str = str(p)
        pattern = re.compile(r'<td>.*?</td>')  # ? 非贪婪模式
        content = re.findall(pattern, p_str)

        factor = int(len(content) / 7)
        car_type = [car] * factor  # 创建车型列表
        n_list = []
        for i in range(factor):
            n_list.append(i * 7)

        displacement = []
        gearbox = []
        engine = []
        engine_type = []
        fuel_consumption = []
        fuel_consumption_range = []
        owner_quantity = []

        for i in n_list:
            displacement.append(content[i][4:-5])
            gearbox.append(content[i + 1][4:-5])
            engine.append(content[i + 2][4:-5])
            engine_type.append(content[i + 3][4:-5])
            fuel_consumption.append(content[i + 4][4:-5])
            fuel_consumption_range.append(content[i + 5][4:-5])
            owner_quantity.append(content[i + 6][4:-5])

        temp_df = {"car_type": car_type,
                   "diaplacement": displacement,
                   "gearbox": gearbox,
                   "engine": engine,
                   "engine_type": engine_type,
                   "fuel_consumption": fuel_consumption,
                   "fuel_consumption_range": fuel_consumption_range,
                   "owner_quantity": owner_quantity}
        df_type = pd.DataFrame(temp_df)
        df = pd.concat([df, df_type], axis=0, ignore_index=True)

    except:
        continue

df.to_excel("main.xls", index=False, encoding="utf-8")
df.to_csv("main.txt", index=False)

 

STM32F103是意法半导体(STMicroelectronics)推出的一款基于ARM Cortex-M3内核的微控制器,广泛应用于工业控制、物联网设备等领域。本资料包主要提供了STM32F103在实现RS485通信及Modbus RTU协议的主机和从机模式下的源代码实例,帮助开发者快速理解和应用这一通讯技术。 RS485是一种物理层通信标准,用于构建多点数据通信网络,具有传输距离远、抗干扰能力强的特点。它采用差分信号传输方式,可以实现双向通信,适合于长距离的工业环境。在RS485网络中,通常有一个主机(Master)和一个或多个从机(Slave),主机负责发起通信,从机响应主机的请求。 Modbus RTU(Remote Terminal Unit)是一种常用的过程控制工业通信协议,基于ASCII或RTU(远程终端单元)报文格式,常用于PLC(可编程逻辑控制器)和嵌入式系统之间的通信。Modbus RTU使用串行通信接口,如RS485,以减少布线成本和提高通信效率。 在STM32F103上实现RS485 Modbus RTU通信,首先需要配置GPIO口作为RS485的硬件接口,包括数据线(一般为RX和TX)和方向控制线(DE和RE)。DE线用于控制发送数据时的数据线方向,RE线则用于接收数据时的方向。这些设置可以通过STM32的HAL库或LL库进行编程。 接着,你需要编写Modbus RTU协议栈的实现,这包括解析和构造Modbus报文、错误检测与处理、超时管理等。Modbus RTU报文由功能码、地址、数据和CRC校验码组成。主机向从机发送请求报文,从机会根据接收到的功能码执行相应的操作,并返回响应报文。 在主机端,你需要实现发送请求和接收响应的函数,以及解析从机返回的数据。在从机端,你需要监听串口,解析接收到的请求,执行相应的功能并构造响应报文。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值