自从今天用爬虫把历史开奖数据爬下来以后,劲头还没过去,趁热打铁继续研究了下历史开奖结果中有没有重复数字的问题。
喜欢大乐透的朋友,注意了,重点来了!
先说后区两个数,从设立以来的将近两千次的开奖结果中,后区两个数重复次数还是高的,这也正常。
用随机函数Random选了两个数,然后和历史数据对比:
可以看到历史上出现的次数,出现频率。
然后再来看前区五个数:
本来想学字数统计一样,把历史开奖结果中的数据进行频率统计,结果发现是列表,不能像字典那样进行统计(主要是水平还比较菜!)
于是,咱也不钻牛角尖,改变思想,对历史开奖数据列表进行去重,然后比较前后数量变化,一样能算出重复次数!!!!
先上代码:
for item in lst:
if item not in lst1:
lst1.append(item)
print(len(lst1))
这段代码用来去重,是核心,其它代码就不贴了,运行结果如下:
重点来了!重点来啦!重点来啦!