csv文件中存储了英国与美国Youtube数据,其每列对应的是:点击,喜欢,不喜欢,评论。
1、结合Matplotlib绘制各自的评论数量的图形,体现其评论数主要分布在哪个区间。
import numpy as np
#读取英国数据
GB_comment = np.loadtxt('GB_video_data_numbers.csv',delimiter=',',usecols=(3), unpack=True)
#读取美国数据
US_comment = np.loadtxt('US_video_data_numbers.csv',delimiter=',',usecols=(3), unpack=True)
# 用直方图分析
sp = 50000 #间隔
import matplotlib.pyplot as plt
GB_max = max(GB_comment)
GB_min = min(GB_comment)
GB_bins = (GB_max-GB_min)/sp
US_max = max(US_comment)
US_min = min(US_comment)
US_bins = (US_max-GB_min)/sp
plt.figure(figsize=(20,10))
#设置字体
import matplotlib
font = {
'family':'SimHei',