Python数据分析笔记_第6天(numpy)

numpy知识点

在这里插入图片描述

numpy与matplotlib

  1. 美国youtube1000的数据结合之前的matplotlib绘制出各自的评论数量的直方图
import numpy as np
from matplotlib import pyplot as plt
import matplotlib

us_adress = './youtube_video_data/US_video_data_numbers.csv'
us_csv = np.loadtxt(us_adress, delimiter=',', dtype='int')

# 取评论的数据
us_comments = us_csv[:, -1]  # 每行记录都要,取最后一列评论数据
us_comments = us_comments[us_comments <= 5000]  # 分析多数数据所在范围,取0-5000的数做分析
# 寻找最大最小值,确定数据轴范围
high = us_comments.max()
low = us_comments.min()

# 直方图,确认组距和组数
d = 50  # 由最大最小值,判断合适组距(多数数据集中在0-5000,可以清洗数据不考虑5000之后的数据,也可以传入一个不固定的组距列表)
num = (high - low) // d  # 计算组数

# 绘图
plt.figure(figsize=(15, 4), dpi=80)
plt.hist(us_comments, num)
plt.show()
  1. 了解英国的youtube中视频的评论数和喜欢数的关系,应该如何绘制改图
import numpy as np
from matplotlib import pyplot as plt
import matplotlib

uk_adress = './youtube_video_data/GB_video_data_numbers.csv'
uk_csv = np.loadtxt(uk_adress, delimiter=',', dtype='int')

# 取评论和喜欢的数据(第二列喜欢,最后一列评论)
uk_csv = uk_csv[uk_csv[:, 1] < 700000]  # 清洗数据,对大于700000后的离散点不作分析
uk_comments = uk_csv[:, -1]
uk_likes = uk_csv[:, 1]

# 绘图

plt.figure(figsize=(15, 4), dpi=80)
plt.scatter(uk_likes, uk_comments)
plt.show()
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值