前言
嗨喽,大家好呀~这里是爱看美女的茜茜呐
又到了学Python时刻~
数据集介绍
找从19年到现在的开奖历史数据,我们首先要把这个历史数据拿到,
拿到我们再进行做分析,分析每个号码出现的频率是多少,
哪个多,我们就买哪个,哪个概率高就买哪个(仅供娱乐)
本次不讲如何采集,所以数据是现成的
开发环境
我的开发环境是 anaconda --> jupyter notebook
( 源码、教程、文档、软件点击此处跳转跳转文末名片加入君羊,找管理员小姐姐领取呀~ )
代码展示
导入模块
import numpy as np
import pandas as pd
from pyecharts import options as opts
from pyecharts.charts import Pie
整理数据
df = pd.read_csv('彩票数据集.csv',header=None,index_col=0)
df
总体分析
把红球的号码拿出来
列:从1到6拿到数据
行: 所有行的数据都是想要的数据
red_ball = df.loc[:,1:6]
把蓝球的号码拿出来
blue_ball = df.loc[:,7]
做数据统计
每个号码出现的次数
flatten是numpy.ndarray.flatten的一个函数,即返回一个折叠成一维的数组。
red_ball_count = pd.value_counts(red_ball.values.flatten())
blue_ball_count = pd.value_counts(blue_ball)
x = red_ball_count.index.tolist()
y = red_ball_count.values.tolist()
可视化展示
pie = (
Pie()
.add(""
,[list(z