Python 数据分析与可视化
了解Python数据分析与挖掘技术, 包括Numpy、Pandas科学库的使用,Pyecharts可视化技术。数据的加载、清洗、时序序列等功能
lsqzedu
专注Python、区块链技术文章分享
展开
-
01_创建矩阵三种方式
文章目录numpy与list比较创建矩阵的第1种方式创建矩阵的第2种方式创建矩阵的第3种方式numpy与list比较NumPy系统是Python的一种开源的数值计算扩展。这种工具可用来存储和处理大型矩阵,比Python自身的嵌套列表(nested list structure)结构要高效的多List是列表,可以通过索引查找数值,但是不能对整个列表进行数值运算np.array可以通过...原创 2019-06-26 20:25:34 · 3762 阅读 · 0 评论 -
02_属性、降维、四则运算
文章目录矩阵的常见属性矩阵的四则运算矩阵升降维矩阵的常见属性shape:显示当前矩阵的形状dtype:显示矩阵元素的数据类型,int32则占4个字节,float64则占8个字节size:返回当前矩阵的元素的数量itemsize:返回元素所占空间的大小# 生成了一个3行4列的二维矩阵t1 = np.arange(12).reshape(3,4)# 三个非常重要的属性:值,类型,...原创 2019-06-26 21:21:13 · 286 阅读 · 0 评论 -
03_获取矩阵元素
文章目录采用切片获取行与列表达式筛选行与列采用切片获取行与列t1 = np.arange(12).reshape(3,4)# 获取某个元素且赋值t1[0,0] = 100print(t1)'''[[100 1 2 3] [ 4 5 6 7] [ 8 9 10 11]]'''print('选择连续的行和列')print(t1[0:2,1...原创 2019-06-26 22:02:14 · 503 阅读 · 0 评论 -
04_图片颜色变换
文章目录numpy实现图片换置图片转换前后对比numpy实现图片换置# Python Imaging Library,已经是Python平台事实上的图像处理标准from PIL import Imageimport numpy as np# 加载图片data = Image.open("../data/phone.jpg")# <PIL.JpegImagePlugin.Jp...原创 2019-06-26 22:24:02 · 881 阅读 · 0 评论 -
05_Series、DataFrame的创建
文章目录图解Series与DataFrameSeries介绍DataFrame介绍图解Series与DataFrameSeries介绍Series是Pandas中的一维数据结构,类似于Python中的列表和Numpy中的Ndarray。Series是一维的,能存储不同类型的数据,有一组索引与元素对应。import numpy as npimport pandas as pd...原创 2019-07-23 09:19:30 · 719 阅读 · 0 评论 -
06_高效选择行与列
文章目录基于列名的筛选自然数索引筛选条件过滤的筛选数据保存在DataFrame中之后后续如果要进行数据清理和挖掘则前提要进行数据的筛选操作,本章讲解了三种最常见的数据筛选方式:列名、索引、条件基于列名的筛选import numpy as npimport pandas as pd# 创建一个DataFramedf = pd.DataFrame(data=np.arange(12...原创 2019-07-23 09:28:48 · 297 阅读 · 0 评论 -
07_加载csv、excel文件
文章目录Pandas文件读取API读取CSV文件读取excel文件Pandas文件读取APIpandas提供了一些用于将表格型数据读取为DataFrame对象的函数,其中用的最多的就是read_csv()函数和read_table()pd.read_sql() pd.read_html() pd.read_json() pd.read_excel() pd.read_csv(...原创 2019-07-23 09:37:03 · 282 阅读 · 0 评论 -
08_DF排序与分组实现
在对数据进行处理的时候,排序、分组与聚合是非常常用的操作。在Pandas中此类操作主要是通过orderby、groupby函数来完成的文章目录sort_values排序groupby分组sort_values排序import pandas as pddf = pd.read_csv("../data/groupby.csv")df.info()print(df.head(n=3...原创 2020-02-28 17:54:30 · 1432 阅读 · 0 评论 -
09_散点图显示字段相关性
文章目录加载远程的数据集散点图与乱码问题Matplotlib 是 Python 的绘图库。 它可与 NumPy 一起使用,提供了一种有效的 MatLab 开源替代方案。 默认情况下Aancanda已经集成了MatplotLib可视化绘图库,它也可以和图形工具包一起使用,如 PyQt 和 wxPython。加载远程的数据集import pandas as pdimport matplo...原创 2020-02-28 17:54:51 · 1801 阅读 · 0 评论 -
10_柱状图展示销售数据
文章目录条件筛选的柱状图分组的柱状图柱状图(bar chart),是一种以长方形的长度为变量的表达图形的统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况,用来比较两个或以上的价值(不同时间或者不同条件)条件筛选的柱状图import pandas as pdimport matplotlib.pyplot as plt# 设置微软雅黑,支持中文显示plt.rcParams...原创 2020-02-28 17:55:08 · 1064 阅读 · 0 评论 -
11_饼图展示占有率
文章目录饼图英文学名为Sector Graph,常用于统计学模块。2D饼图为圆形,手画时,常用圆规作图。仅有一个要绘制的数据系列 要绘制的数值没有负值 要绘制的数值几乎没有零值 类别数目无限制 各类别分别代表整个饼图的一部分 各个部分需要标注百分比 # 如何获取数据源import pandas as pdimport matplotlib.pyplot as plt...原创 2020-02-28 17:55:22 · 640 阅读 · 0 评论 -
12_matplotlib API 讲解
文章目录Plotlib折线图设置Plotlib饼图设置Matplotlib 是 Python 的绘图库最大的优势就是灵活性强,因此它有很多参数设置,视频中主要是通过教大家如何参数API的参数配置来学习MapplotlibPlotlib折线图设置# 可视化的高级参数设置import numpy as npimport matplotlib.pyplot as plt# 设置微软雅...原创 2020-02-28 17:55:39 · 398 阅读 · 0 评论 -
13_matplotlib 高级参数设置
文章目录层叠柱状图可视化 (上)层叠柱状图可视化 (下)Matplotlib 是 Python 的绘图库最大的优势就是灵活性强,因此它有很多参数设置,视频中主要是通过教大家如何参数API的参数配置来学习Mapplotlib,官网地址为:https://matplotlib.org/层叠柱状图可视化 (上)# 可视化的高级参数设置import numpy as npimport ma...原创 2019-07-24 21:25:40 · 383 阅读 · 0 评论 -
14_如何生成时间序列
文章目录如何通过日期获取数据data_range生成时间序列时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测如何通过日期获取数据# 时间序列简单来说:就是采用时间作为索引来进行相关的操作import numpy as npimport pandas as pdfrom pandas im...原创 2019-07-24 21:33:37 · 1820 阅读 · 0 评论 -
15_共享单车租赁分析
文章目录加载共享单车数据时间序列为索引柱状图显示相关的租赁数据时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测加载共享单车数据import pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']...原创 2019-07-24 21:38:17 · 830 阅读 · 0 评论 -
16_分析共享单车日活跃用户
文章目录日期进行采样操作分组统计每小时的骑行记录时间序列(或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列。时间序列分析的主要目的是根据已有的历史数据对未来进行预测日期进行采样操作import pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif'] = ['Si...原创 2019-07-24 21:42:45 · 414 阅读 · 0 评论