Python数据分析与可视化

l   数据合并
2  数据清洗
3  数据转换
 

数据结构转换
常见的数据结构转换方法
Pandas库中常用的数据结构转换方法有数据堆叠(stack)、数据拆堆(unstack)、数据融合
(melt)、数据透视(pivot)
数据堆叠(stack)∶将一个表格对象的列名称转换为行索引,实现数据从矩阵排布到单列排布
的堆叠。


数据拆堆unstack方法解析
数据拆堆:将一个表格对象的行索引转换为列索引,实现数据从单列排布到矩阵排布的转换数据拆堆语法:多层索引序列对象.unstack(level=-1,fill_value=None)
Level表示要将哪个索引层级的行索引转换为列索引,默认为-1,即最内层索引fill_value表示用于填充缺失值的值,默认为空值
注意:表格对象也可以使用数据拆堆unstack方法,行索引转列索引后,只有一行数据的表格对
象退化为一个序列对象。


类别型数据转数字型数据的方法——哑变量处理
在数据挖掘技术中,数学算法需要接收数字信息,但是数据中的信息有时候是一些字符型的类别
型数据(如:性别、等级)),有必要将类别型数据转换成数字型数据。
同时还要保留类别型数据中蕴含的信息。
生成的数字数据又叫做“哑变量”。

哑变量实现的函数解析

语法:
get_dummies(data,prefix,prefix_sep='_',columns)
参数    作用
data   需要数据化的类别型数据序列对象
prefix  新生成数字型数据的名称前缀
prefix_sep  新生成数字型数据名称前缀连接的符号,默认是'_'
columns   data输入的是表格对象时使用,指定需要数字化的列名称,接收一个列表

区间的概念
“区间”指的是数字的范围。一般用括号和数字表示一个区间。
( a , b ]表示一个区间,不包括a,但是包括b。数字1不属于(1,2),但1属于[1,2)。

Pandas中有一个Interval类可以生成“区间”对象
 

#区间对象
interval = pd.Interval(0,100)print(interval)
print(50 in interval)

(0,100]

True
数据分箱函数pd.cut()解析
pd.cut(data=None, bins=None, labels=None)

1  Matplotlib画图基本语法
2  常见的图形及其绘制方法
3  同时绘制多张图的方法


图表的基础组成部分

Matplotlib画图牛刀小试

import matplotlib. pyplot as plt
plt.plot(
     [1,2,3,4,5],
     [1,3,4,8,3],
     'r--'
)


选择绘图函数——以plot函数(折线图)为例
绘图函数决定要绘制什么样的图形,不同的图形有不同的函数名称(见后面内容)
绘图语法: plt.plot(x, y, color,linestyle,marker,format_string,..)


设置画布
画布类似画画时的画板,决定了我们的图形的大小,默认的画布为白色,看不见其边界。

语法:   plot.figure(figsize....)
figsize:接收元组(a,b),a表示画布的长,b表示画布的高

plt.figure(figsize=(8,2))
plt.plot([1,2],[1,3])

[<matplotlib.lines.Line2D at 0x27c474a4430>]

设置坐标轴
坐标轴分为x轴和y轴,其内容包括坐标轴标题、刻度、范围和网格线.

Matplotlib库中通过不同函数控制以上坐标轴的设置。

添加文本标签
可以在画布中任意位置一次性添加一个文本信息
语法:   plot.text(x, y,s, ha, va,fontsize,color...)

设置标题和图例
标题显示在画布和图表的正上方。图例一般显示在图表角落,用于描述数据的含义

显示标题语法: plot.title(‘标题’)
显示图例语法: plot.legend(‘数据标签’,loc,fontsize,..).

loc参数:决定图例的位置,如“upper right”表示右上方

  • 18
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值