Python——基于共享单车使用量数据的可视化分析(2)

目录

3️⃣ 4.3 利用条形图、折线图探究单车使用量和季节的关系

📍 折线图 

 4️⃣ 4.4 利用条形图、折线图探究单车使用量和月份的关系

 5️⃣ 4.5 利用条形图、箱线图探究单车使用量和星期的关系

6️⃣ 4.6 利用箱线图探究单车使用量和天气的关系

📈 5、拟合回归线

1️⃣ 5.1 利用条形图、折线图探究单车使用量和温度、湿度和风速的关系

📍 ggplot画图步骤及方法

◾ df = ggplot(data, aes(x, y))

◾ 画图形

◾ 添加线条有多种类型的方法

◾ 文本设置

🔷 单车使用量与温度的关系

🔷 单车使用量与湿度的关系

🔷 单车使用量与风速的关系 

🌳 6、利用决策树预测单车的使用量

1️⃣ 将数据分为训练集和测试集

2️⃣ 导入库和建立模型

 📍  用于创建决策树回归模型的类DecisionTreeRegressor(criterion,splitter,max_depth,min_samples_split,min_samples_leaf,min_weight_fraction_leaf,max_features,random_state,max_leaf_nodes,min_impurity_decreas,ccp_alpha)

3️⃣ 决策树可视化

 📍 将决策树可视化

4️⃣ 查看特征重要性并绘制条形图


3️⃣ 4.3 利用条形图、折线图探究单车使用量和季节的关系

📍 折线图 

plt.plot(x, y, format_string, **kwargs, color, linestyle, linewidth, marker, markersize, markeredgecolor, markerfacecolor)

字段 数据类型 含义

x, y

数组 or list

x 和 y 是表示数据点坐标的序列。x 是x轴上的坐标值,y 是对应的y轴上的坐标值

format_string

str

可选的字符串,用于指定线条的样式、颜色和标记。例如,'r-' 表示红色实线,'go' 表示绿色圆圈标记

color

str or 

颜色代码

参数用于指定线条的颜色。可以是颜色的名称(如'red'),十六进制颜色代码(如'#FF0000'),RGB元组(如(1.0, 0.0, 0.0))等

linestyle

str

指定线条的样式。例如,'-' 表示实线,'--' 表示虚线,'-.' 表示点划线,':' 表示点状线,' '(空格)表示没有线条

linewidth

float or int

用于指定线条的宽度

marker

str 

指定数据点的标记样式。例如,'o' 表示圆圈,'.' 表示点,',' 表示像素点,'s' 表示正方形等

markersize

float or int

指定标记的大小

markeredgecolor

str or 

颜色代码

指定标记边缘的颜色

markerfacecolor

str or 

颜色代码

指定标记填充的颜色

# 1.绘图
### 分组聚合
season_Aggregated = pd.DataFrame(data.groupby(['年份','季节']).sum())['使用量'].reset_index()   
# 将data的数据,根据'年份'、'季节'进行分组'进行分组,并统计总数,然后根据'使用量'进行重新编排索引

# 2.绘制条形图
plt.figure(figsize=(14, 8))
plt.subplot(1, 2, 1)

plt.bar(season_Aggregated['季节'][:4]-0.2,    # 数据
        season_Aggregated['使用量'][:4],      # 数据
        width=0.4,                           # 表示柱状图的宽度
        color='green', label='2011')        # 设置柱子颜色和标签

plt.bar(season_Aggregated['季节'][4:]+0.2,       # 数据
        season_Aggregated['使用量'][4:],         # 数据
        width=0.4,                               # 表示柱状图的宽度
        color='yellow', label='2012')            # 设置柱子颜色和标签

plt.title('使用量与季节关系条形图', fontsize=15)    # 设置图形的标题以及文字的打下
plt.xlabel('季节', fontsize=15)               # 设置x轴标签以及字体大小
plt.ylabel('使用量', fontsize=15)             # 设置y轴标签以及字体大小
plt.xticks([1, 2, 3, 4], ['春季', '夏季', '秋季', '冬季']) # 设置x轴刻度以及对应刻度的标签
plt.legend(loc='best')     # 设置图例位置

# 3.绘制折线图
plt.subplot(1, 2, 2)
plt.plot(season_Aggregated['季节'][:4],
         season_Aggregated['使用量'][:4],
         color='green',                      # 设置颜色
         lw=3,                                # 设置折线的宽度
         marker='o',                         # 设中的点的标记图形
         label='2011')
plt.plot(season_Aggregated['季节'][4:],
         season_Aggregated['使用量'][4:],
         color='yellow',                          # 设置颜色
         lw=3,                                   # 设置折线的宽度
         marker='o',                            # 设中的点的标记图形
         label='2012')

plt.title('使用量与季节折线图', fontsize=15)
plt.xlabel('季节', fontsize=15)
plt.ylabel('使用量', fontsize=15)
plt.xticks([1, 2, 3, 4], ['春季', '夏季', '秋季', '冬季'])
plt.legend(loc='best')
plt.grid(True)                                             # 在图形内部显示网格线

 4️⃣ 4.4 利用条形图、折线图探究单车使用量和月份的关系

# 1.绘图
### 分组聚合
month_Aggregated = pd.DataFrame(data.groupby(['年份','月份']).sum())['使用量'].reset_index()
# 将data的数据,根据'年份'、'月份'进行分组'进行分组,并统计总数,然后根据'使用量'进行重新编排索引

# 2.绘制条形图
plt.figure(figsize=(14, 10))
plt.subplot(2, 1, 1)
plt.bar(month_Aggregated['月份'][:12]-0.2,
        month_Aggregated['使用量'][:12],
        width=0.4,                             # 表示柱状图的宽度
        color='blue', label='2011')

plt.bar(month_Aggregated['月份'][12:]+0.2,
        month_Aggregated['使用量'][12:],
        width=0.4,                             # 表示柱状图的宽度
        color='gold', label='2012')

plt.title('使用量与月份关系条形图', fontsize=15)
plt.xlabel('月份', fontsize=15)
plt.ylabel('使用量', fontsize=15)
plt.xticks(np.arange(1, 13))                   # 横坐标为1-12
plt.legend(loc=&#
  • 17
    点赞
  • 15
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 利用Python数据可视化库,例如matplotlib, seaborn等,可以对共享单车数据进行可视化分析。可以通过线性图、散点图、柱状图等方式呈现数据,进而分析单车使用情况、用户需求、地域分布等方面的情况。同时,也可以将数据生成为地图信息,用于分析单车分布及用户活跃度等方面的情况。 ### 回答2: 共享单车数据可视化是一种将大数据转化为可视化信息的技术,可以将庞大的数据通过图表、地图等方式呈现出来,方便用户直观地了解共享单车使用状况以及市场需求。Python作为目前流行的编程语言之一,拥有众多强大的数据处理和可视化工具,适合用于共享单车数据可视化开发。 首先,Python可以通过数据处理和可视化库来读取和处理共享单车数据,如pandas、numpy等。通过这些库可以将数据读进内存并进行处理,如去除异常值、统计分析等,从而得出有用的信息。在数据处理完成后,可以使用Python可视化库,如matplotlib、seaborn和bokeh,来呈现数据可视化信息,包括散点图、折线图、柱状图、热力图和地图等。通过这些图表可以更加清晰地了解共享单车使用的规律和趋势。 其次,Python的GIS(地理信息系统)库,如Folium、Basemap和GeoPandas,可以制作具有地图交互性的可视化数据,用于展示共享单车的实时位置和使用情况等信息。使用这些库可以将GPS定位的数据呈现在地图上,或者将统计数据与以地图为背景的信息进行对比。同时,也可以将共享单车数据与其他数据集结合起来,如人口分布和地理环境等数据集。 最后,Python还可以用于共享单车数据的机器学习建模和预测分析。例如,可以使用Python的机器学习库,如Scikit-learn和Tensorflow,建立模型,对共享单车使用量和需求进行预测。通过这些模型得出的预测结果可以反馈到共享单车的经营管理,提高共享单车使用效率、提高盈利能力、缩短单车维护的时间、降低单车报废的风险等方面。 总之,通过使用Python数据处理、可视化、GIS和机器学习库,可以对共享单车数据进行更加全面、深入的分析和呈现。这些可视化信息能够为共享单车公司提供更好的决策依据,并持续推动共享单车行业的发展。 ### 回答3: 自从共享单车出现以来,其越来越普及,成为了现代城市的一种新型交通工具。近年来,共享单车数据可视化分析也成为了越来越流行的研究领域。Python是一种流行的编程语言,拥有丰富的数据处理和可视化工具,为共享单车数据可视化提供了完美的平台。 在共享单车数据可视化,我们可以使用Python的matplotlib和seaborn来绘制单车使用情况的地图和相关统计数据的图表,并使用Pandas来对数据进行整合和处理。另外,还可以使用Python的基于Web的框架来开发一个交互式的可视化应用。 例如,我们可以使用Python提供的GeoPandas来绘制地图并标记出单车站点、使用量等相关信息。同时,使用得到的数据可以使用Pandas进行分类、聚合等数学操作,以得到更详细的数据可视化模型。 此外,还可以使用诸如D3.js等JavaScript工具和框架,根据Python处理的数据创建更加交互式和动态的可视化效果。Python还提供了Jupyter Notebooks这种交互式的编程环境,方便科学家和数据分析师进行数据探索和快速可视化。 综上所述,Python作为一种非常强大的编程语言,可以帮助我们进行共享单车数据可视化分析。不仅可以快速处理、整合数据,还能使用丰富的可视化工具绘制出更生动、直观的数据图像,帮助我们更好地了解共享单车使用情况和相关趋势。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cherry晴

创作不易,多多包涵~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值