2018-1-8 星期一
发现了一个比较好筛选的一个双色球开奖结果公布网站(http://kaijiang.500.com/shtml/ssq/18003.shtml),页面代码逻辑超级简单,我就选择他辣。取所有开奖结果直接insert到sqlsever数据库中。
#/usr/bin/python
#coding=utf-8
__author__='jeremy'
import re
import pyodbc
import urllib2
for i in xrange(17001,17154):#遍历2017年所有期数开奖结果
try:
url='http://kaijiang.500.com/shtml/ssq/%s.shtml'% i#这里将期数的值附到网址上便于访问
response = urllib2.urlopen(url) #response内存上给读取网页内容分配的空间位置
strUrl = response.read() #读response的内容到strUrl字符串变量中
redBall_strList = re.findall('<li class="ball_red">.*',strUrl)#正则取红球
blueBall_strList = re.findall('<li class="ball_blue">.*',strUrl)
Ball_list = [i]