plotly笔记–简单平面图形的绘制
文章目录
这篇文章将简单描述怎么使用plotly绘制常用的平面图形,文中使用到的数据是从天池下载的经典泰坦尼克训练数据集,需要此数据的小朋友们可以前往天池下载,我也会将文中使用到的数据和源代码放在Github上以便下载: Github
前期准备
# 前期准备
#导入plotly
import plotly
# 查看库的版本
plotly.__version__
# 注意此处是两个"_"
import pandas as pd
import numpy as np
import os
# 查看当前路径
os.getcwd()
# 更改当前工作目录
os.chdir("F:/天池数据集/泰坦尼克/")
# 将目录里的内容输出为列表
os.listdir()
# 读入数据
titain_data = pd.read_csv("titanic_train.csv")
# 对数据情况大致了解一下
titain_data.head()
titain_data.info()
titain_data.describe()
# 观察数据类型,缺失值,最值等方面信息,对如何进行后面的数据处理整体把控
# 对Age项统计缺失值
titain_data["Age"].isnull().sum()
# 对Age的空值进行前向替换
titain_data["Age"].fillna(method="ffill", inplace=True)
# 再次查看缺失值状况
titain_data["Age"].isnull().sum()
# 对目标字段进行描述
titain_data["Age"].describe()
# 对数据中年龄进行分段统计,并使用plotly绘制出散点图/线形图
w = [0, 15, 30, 45, 60, 100]
titain_data["Age_bin"] = pd.cut(
titain_data["Age"],
bins=w,
labels=['0-15岁', '15-30岁', '30-45岁', '45-60岁', '60岁以上'],
right=False)
Age_x = titain_data["Age_bin"].value_counts(sort=False)
# titain_data.head()
Age_x
x = list(Age_x.ind