【Python爬虫】【两色球】历史数据爬取&概率分析

话不多说,直接上代码

1、爬取历史开奖记录

import requests
from bs4 import BeautifulSoup
import re
import pandas as pd


# 返回字符串中的数字
def extract_numbers(s, is_str=True):
    if is_str:
        return ''.join([num for num in re.findall(r'\d+', s)])
    else:
        return [int(num) for num in re.findall(r'\d+', s)]

# 网站的开奖号是图片,需字典映射成数字
img_to_num = {
    '20180820032902101600.png': '1', '20180820032902102212.png': '2', '20180820032902103176.png': '3',
    '20180820032902104855.png': '4', '20180820032902105626.png': '5', '20180820032902106488.png': '6',
    '20180820032902107839.png': '7', '20180820032902108769.png': '8', '20180820032902109210.png': '9',
    '20180820032902110435.png': '10', '20180820032902111316.png': '11', '20180820032902112341.png': '12',
    '20180820032902113809.png': '13', '20180820032902114700.png': '14', '20180820032902115788.png': '15',
    '20180820032902116463.png': '16', '20180820032902117946.png': '17', '20180820032902118438.png': '18',
    '2018
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值