好久没更新了,最近工作才慢慢进入正轨,才有时间来慢慢记录自己喜欢和感兴趣的事。
前段时间看到有朋友在研究双色球的事,顺便学习了一下,感觉可以用我们所学来简单的预测一下下一期的双色球事多少,所以我爬取来往期所有中奖的双色球的号码,讲真这个纯属好玩。
下面上代码:
import re
import requests
from bs4 import BeautifulSoup as BS
def GetPage(url):
headers={
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.100 Safari/537.36',
'Host': 'kaijiang.zhcw.com',
'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3'
}
response = requests.get(url,headers=headers)
text=BS(response.text,'lxml')
return text
def GetText():
for i in range(1,120):
url='http://kaijiang.zhcw.com/zhcw/html/ssq/list_{}.html'.format(i)
print(url)
text=GetPage(url)
ems=text.find_all('em')
divs=text.find_all('td',{'align':'center'})
n=0
with open('./result.txt','a')as f:
for em in ems:
message=em.get_text()
n=n+1
if n==7:
n=0
message=message+"\n"
else:
message+='\t'
f.write(str(message))
if __name__=='__main__':
GetText()
运行结果:
下面是结果集:
我们可以在这些数据上进行简单的分析,可以得到哪些数字在中奖数字里出现最高,也是比较interesting的额