python可视化数据分析交互作用_python数据分析实例:共享单车租用影响因素探索...

本文利用Python对UCI提供的共享单车数据集进行探索性分析,研究租车情况与日期、季节、天气等因素的关系。通过数据清洗、特征构造,发现租车人数与气温、湿度、时间等因素存在关联,如早晚高峰、晴天租车人数较多。通过可视化展示,揭示了不同季节、天气、工作日与租车数量的模式。
摘要由CSDN通过智能技术生成

UCI网站(Bike Sharing Dataset Data Set)提供了某城市的共享单车2011年到2012年的数据集。该数据集包括了租车日期,租车季节,租车天气,租车气温,租车空气湿度等数据。本次将使用python对这一数据集进行探索性分析,以了解共享单车的租用情况与哪些因素有关。

Data Fields(数据特征描述):datatime - 日期+时间

season -

1=春天

2=夏天

3=秋天

4=冬天

holiday - 是否是节假日

workingday -

1=工作日

0=周末

weather -

1:晴天,多云

2:雾天,阴天

3:小雪,小雨

4:大雨,大雪,大雾

temp - 气温摄氏度

atemp - 体感温度

humidity - 湿度

windspeed - 风速

casual - 非注册用户个数

registered - 注册用户个数

count - 给定日期时间(每小时)总租车人数

0,环境搭建

环境:win10+Anaconda +jupyter Notebook

包:

数据分析包:Numpy,pandas,

画图包:matplotlib,seaborn ,

缺失值可视化查询包:missingno

日期变量处理相关的包:calendar,datetime

1,准白工作

用jupyter notebook处理数据,需要先做一些准备,需先把一些必要的数据分析包导入操作台。#数据处理包导入

import numpy as np

import pandas as pd

#画图包导入

import matplotlib.pyplot as plt

import missingno as msno

import seaborn as sns

sns.set()

#日期处理包导入

import calendar

from datetime import datetime

#jupyter notebook绘图设置

%matplotlib inline

%config InlineBackend.figure_format="retina"

#读取数据

BikeData = pd.read_csv("bike.csv")

数据读取后,可以开始对数据进行简单的预览。

预览内容主要包括了解数据集的大小,字段的名称,数据格式等等,为后续的数据处理工作做准备。数据集大小BikeData.shape

#输出:

(10886, 12)查看数据表中具体的数据内容,不查看所有数据,只查看开始或结束的几行,

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值