数据分析及可视化 散点图的绘制

Python数据可视化之散点图的绘制

import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
df = pd.read_csv('C:/Users/asus/Desktop/jintiguan/transcount.csv')
df = df.groupby('year').aggregate(np.mean)   # 提取数据
gpu = pd.read_csv('C:/Users/asus/Desktop/jintiguan/gpu_transcount.csv')
gpu = gpu.groupby('year').aggregate(np.mean) # 提取数据
df = pd.merge(df,gpu,how = 'outer',left_index = True,right_index = True)
df = df.replace(np.nan,0)
years = df.index.values
counts = df['trans_count'].values
gpu_counts = df['gpu_trans_count'].values
cnt_log = np.log(counts)
plt.scatter(years,cnt_log,c = 200 * years,s = 20 + 200 * gpu_counts / gpu_counts.max(),alpha = 0.5)
plt.show()

在这里插入图片描述

# 绘制箭头
gpu_start = gpu.index.values.min()
y_ann = np.log(df.at[gpu_start,'trans_count'])
ann_str = "First GPU\n %d"%gpu_start   #设置箭头的标签
plt.annotate(ann_str,xy = (gpu_start,y_ann),arrowprops = dict(arrowstyle = "->"),xytext = (-30,+70),textcoords = 'offset points')  #在指定位置绘制箭头

# 绘制散点图
cnt_log = np.log(counts)  # 求y轴均值的对数
plt.scatter(years,cnt_log,c = 200 * years,s = 20 + 200 * gpu_counts / gpu_counts.max(),alpha = 0.5,label = "Scatter")  #绘制散点图,在绘画的同时进行纵坐标的均值的对数计算
plt.legend(loc = "upper left")  #设置图例的位置,upper left:左上
plt.grid()  # 绘制背景辅助线(灰线)
plt.xlabel("Year")    # 设置x轴标签
plt.ylabel("Log Transistor Counts",fontsize = 16)   # 设置y轴标签
plt.title("Moore's Law & Transistor Counts")   # 设置大标题
plt.show()

在这里插入图片描述
数据文件网盘自取:https://pan.baidu.com/s/1cmOI_IVPWOiwiLXS-993Xg
提取码:fiw2

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
基于Python爬虫的图书评价数据分析可视化是一种通过爬取图书评价数据,利用Python进行数据分析可视化的方法。 首先,我们需要使用Python的爬虫技术,通过爬取图书网站的评价数据,将数据保存到本地或数据库中。可以利用“requests”库发送HTTP请求获取网页内容,然后使用“BeautifulSoup”库解析网页,提取出所需的评价数据。 接下来,使用Python中的数据分析库,如“Pandas”和“Numpy”,对爬取到的图书评价数据进行处理和分析。可以进行数据清洗,剔除掉缺失或异常的数据;进行数据统计,计算平均评分、评价数量等指标;进行特征提取,提取出关键词、标签等信息。 然后,可以使用Python中的数据可视化库,如“Matplotlib”和“Seaborn”,对数据进行可视化展示。可以绘制柱状图、折线图、散点图等,展示不同图书评分的分布情况;可以绘制词云图、饼图等,展示评价中的关键词和类别分布情况。 最后,结合数据分析可视化的结果,我们可以得出一些有关图书评价的结论。例如,通过分析评分分布,可以了解图书的受欢迎程度;通过分析关键词分布,可以了解读者对图书内容的关注点;通过比较不同图书的评价情况,可以进行图书推荐等。 综上所述,基于Python爬虫的图书评价数据分析可视化是一种通过爬取图书评价数据,利用Python进行数据分析可视化的方法,可以帮助我们深入了解图书评价情况,并得出一些有关图书的结论和建议。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值