机器学习入门之 pandas

pandas 有三种数据结构

一种是 Series

一种是 Dataframe

import  pandas as  pd
import  numpy as  np
score = np.random.randint(0,100,[10,5])

score[0,0] = 100

Datascore = pd.DataFrame(score)

subject = ["语文","数学","英语","物理","化学"]

Datascore.columns = subject

stuName = {"同学"+ str(i) for i  in range(10)}

Datascore.index = stuName

print(Datascore)

print(Datascore.shape)

使用  列表  做数据传入  可以更方便使用列表的下标更改数据

import  pandas as  pd
import  numpy as  np
import  matplotlib.pyplot as  plt
# 读取 csv的 文档
starbucks =    pd.read_csv('directory.csv')
# 按照 Country 进行分组聚合
count = starbucks.groupby(['Country']).count()
# 绘制直线图
count['Brand'].plot(kind = "bar",figsize=(20,8))
plt.show()

import  matplotlib.pyplot as plt
import pandas as pd
import numpy as  np
# 使得数据显示完全
pd.set_option('display.max_columns', 1000)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth', 1000)

# 读取文件
MovieDate = pd.read_csv("IMDB-Movie-Data.csv")
# 取平均值  取平均值函数 mean()
meanData=MovieDate["Rating"].mean()
print(meanData)
# 获取导演的人数  使用获取标签  然后使用 unipue去掉重复值  然后获取到对应的数量
DirectorCount = MovieDate["Director"].unique().shape[0]
print(DirectorCount)
import  matplotlib.pyplot as plt
import pandas as pd
import numpy as  np
# 使得数据显示完全
pd.set_option('display.max_columns', 1000)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth', 1000)

# 读取文件
MovieDate = pd.read_csv("IMDB-Movie-Data.csv")
# 取平均值  取平均值函数 mean()
meanData=MovieDate["Rating"].mean()

# 获取导演的人数  使用获取标签  然后使用 unipue去掉重复值  然后获取到对应的数量
DirectorCount = MovieDate["Director"].unique().shape[0]

# 获得 Rating  和 Values的分布
# 使用pandas的画图工具来画的话,无法精细的描绘图像,还是需要使用matplotlib
MovieDate["Rating"].plot(kind="hist")
# 创建画布
plt.figure(figsize=(20,8),dpi=100)
# 描绘直方图  添加数据就可以弹出图形
plt.hist(MovieDate["Rating"])
# 修改刻度
# 确定最大值  最小值   分组
Maxrate = MovieDate['Rating'].max()
Minrate = MovieDate['Rating'].min()
# linespace  np的一个函数  可以创建等差数列,这些数列均匀的分布在范围内  返回一维数组类型
# start end num-->分成的组数
xticks=np.linspace(Minrate,Maxrate,num=21)
# 只能填入
plt.xticks(xticks)
plt.show()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值