python在人力资源数据分析统计服_Python数据分析之双色球高频数据统计

Step1:基础数据准备(通过爬虫获取到),以下是从第一期03年双色球开奖号到今天的所有数据整理,截止目前一共2549期,balls.txt 文件内容如下 :

31dccfbfdf6f2321ecc1aca0aae3613d.png

每行的前6列数据是红球 每行的最后1列数据是篮球

Step2:分析数据特征和数据处理方式选择,直接上代码如下:

#导入Counterfrom collections import Counterdef readfile(): red_lists=[] blue_lists=[] #打开文件并获取文件句柄 with open("./balls.txt", "r",encoding='utf-8') as fp: #开始读取文件并返回一个list list1=fp.readlines() #遍历整个文件内容 for i in range(len(list1)): #替换掉的字符再按空格分隔 list2=str(list1[i]).replace("","").split(" ") for j in range(len(list2)): if j==6: #蓝球放入到blue_lists 列表中 blue_lists.append(list2[j]) else: #红球放入到red_lists 列表中 red_lists.append(list2[j]) #Counter可以快速便捷的对某些对象做一些统计操作,这里是对列表里面的数据进行出现次数统计,返回一个tuple red_count=Counter(red_lists) blue_count=Counter(blue_lists) #most_common可以用来统计列表或字符串中最常出现的元素并做排序,并返回一个list k = red_count.most_common(len(red_count)) #输出出现频率最高的六个红球 print("the red ball:",k[:6]) l = blue_count.most_common(len(blue_count)) #输出出现频率最高的六个蓝球 print("the blue ball:",l[:6]) if __name__=="__main__": readfile()

总结:python在数据处理方面有着非常强大的优势,其实早先用过Panda库也可以非常出色的完成双色球的数据统计,大家有兴趣的可以实验一下。

6a9d93641e84539f822b7248be4ac113.png

如果你需要python学习资料的话,加v:a74842013领取哦!万事开头难,如果觉得初学Python有些不容易,那我相信这本书会让你的Python学习变得有趣且简单起来!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值