体育彩票数据抓取
最近感觉该为祖国体育事业做出自己的贡献了,准备买个体彩感谢党。
在买之前还是想做一点点研究的,否则万一中奖好像全是靠运气。。。虽然肯定是运气。但是依然不影响对体彩数据进行分析,目前思路是可以从单个号码或组合号码时间序列分析。下面是爬取最近120期的中奖球号数据代码:
##爬取体彩信息
import requests
import re
import time
import os
import pandas as pd
url='http://m.55123.cn/kjh/p3-history-120.htm'
h=[]
def get_page(url):#获取当前连接的HTML源代码
response = requests.get(url)
if response.status_code == 200:
return response.text#返回HTML源代码
return None
def parse_page(html):
pattern = re.compile( '.*?<li><span class=\'dates\'>(.*?)</span></li>.*?<span class=\'ball lred\'>(.*?)</span>.*?<span class=\'ball lred\'>(.*?)</span>\r\n.*?<span class=\'ball lred\'>(.*?)</span>.*?', re.S)
items = re.findall(pattern, html)
h.append(items)
html = get_page(url)
parse_page(html)
df=pd.DataFrame(h[0])