Python数据分析
Small-J
当野心撑不起才华时,我选择学习
展开
-
Pyecharts数据可视化
文章目录Pyecharts第三方数据可视化Pyecharts 介绍特性pyecharts 安装检查版本的安装绘制Pyecharts的三种方式Pyecharts绘制图表:生成HTML在Jupyter notebook 上直接展示Pyecharts生成图片全局配置项InitOpts 初始化配置项TitleOpts 标题配置项LegendOpts 图例配置项TooltipOpts 提示框配置项ToolboxOpts 工具项配置AxisOpts 坐标轴配置项DatazoomOpts 区域缩放配置项系列配置项Labe原创 2020-08-02 15:30:00 · 14658 阅读 · 1 评论 -
Seaborn第三方绘图(二)
文章目录FacetGrid与调色盘FacetGrid结构图Axes绘图FacetGrid使用Axes 与 FacetGrid绘图设置图形的尺寸添加图例设置标题设置坐标轴设置背景颜色Seaborn样式风格设置风格设置函数FacetGrid与调色盘FacetGrid结构图之前我们在绘图的时候,学了relplot、catplot、lmplot等,这些函数可以通过col、row等在一个Figure中绘制多个图。这些函数之所以有这些功能,是因为他们的底层使用了FacetGridAxes绘图实际上seabor原创 2020-06-04 00:07:01 · 6065 阅读 · 0 评论 -
Seaborn第三方绘图
Seaborn第三方绘图关系型绘图Seaborn介绍Seaborn是一个基于matplotlib且数据结构与pandas统一的统计图制作库。他提前已经定义好了一套自己的风格。然后也封装了一系列的方便的绘图函数,之前通过matplotlib需要很大代码才能完成绘图,使用seaborn可能是一行代码的事情。Seaborn是基于matplotlib的Python数据可视化库。它提供了用于绘制引人入胜且内容丰富的统计图形的高级界面。Seaborn的绘图关系型绘图分类型绘图分布型绘图线性绘图S原创 2020-05-30 18:59:16 · 4828 阅读 · 0 评论 -
Pandas使用 (五)
文章目录5-5 索引与分层索引查看索引重置索引指定索引返回index的唯一值分层索引分层索引即切片交换索引5-6 时间序列时间序列前言时间序列基础生成时间序列索引时间序列索引及选择数据时间序列也含有重复的索引移位日期5-7 重采样重采样介绍练习5-5 索引与分层索引查看索引df.index查看索引注意 : 索引值不能够单独赋值,只能进行整体的赋值In [6]: import pandas as pdIn [7]: import numpy as npIn [8]: df =原创 2020-05-21 15:01:31 · 2813 阅读 · 0 评论 -
Pandas使用(四)
文章目录离散化计算虚拟变量5-4 数据规整与分组数据合并数据分组与聚合离散化离散化是把无限空间中有限的个体映射到有限的空间中去,以此提高算法的时空效率。可以简单理解为离散化就是将连续值进行分区间。采用pd.cut()方法。pd.cut(x,bins)x : 要进行分组的数据bins : 指定是分组pd.value_counts(value)values : 数据计算数据出现的数据# @Time : 2020/5/16 13:24 # @Author : SmallJ原创 2020-05-18 14:23:58 · 2912 阅读 · 0 评论 -
Pandas使用(三)
文章目录描述性统计的概述和计算5-3 Pandas数据清洗数据清洗介绍处理缺失值判断数据是否为nan过滤缺失值补全缺失值异常值处理重复数据描述性统计的概述和计算方法描述count非nan值的个数min最小值max最大值argmin最小值索引位置(整数索引)argmax最小值标签索引(整数索引)idxmin最小值的标签索引idxmax最大值的标签索引sum求和mean平均值median中位数var方差原创 2020-05-14 15:33:16 · 11601 阅读 · 5 评论 -
Pandas使用(二)
文章目录DataFrame介绍DataFrame创建DataFrame基础操作DataFrame查询DateFrame索引Pandas字符串的常用方法使用loc及iloc选择数据DataFrame算术DataFrame排序DataFrame介绍DataFrame表示的是矩阵的数据表,它包含已排序的列集合,每一列可以是不同的值类型(数值,字符串布尔值)。在DataFrame中,数据被存储为一个以上的二维块DataFrame创建[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(im原创 2020-05-10 02:33:49 · 2073 阅读 · 0 评论 -
Pandas使用
5-1 Pandas介绍与安装为什么会有Pandas Pandas支持大部分Numpy语言风格,尤其是数组函数与广播机制的各种数据处理。单是Numpy更适合处理同质型的数据。而Pandas的设计就是用来处理表格型或异性数据的,高效的清洗、处理数据。Pandas是什么? Pandas是基于Numpy的一种工具,提供高性能矩阵的运算,该工具是为了解决数据分析任何而创建的。也是贯穿整个Pyt...原创 2020-05-05 00:22:31 · 1893 阅读 · 0 评论 -
Numpy的使用(二)
数组拼接np.vstack()垂直拼接In [1]: import numpy as npIn [2]: arr = np.arange(12).reshape(3,4)In [3]: arrOut[3]:array([[ 0, 1, 2, 3], [ 4, 5, 6, 7], [ 8, 9, 10, 11]])In [4...原创 2020-04-30 14:29:53 · 1109 阅读 · 0 评论 -
Numpy的使用
4- Numpy介绍和安装4-1 Numpy介绍与安装为什么使用Numpy? 因为Numpy的底层实现是使用C++语言来编写的。执行效率会非常的高Numpy是什么? Numpy(Numerical Python) 是目前Python数值计算中最为重要的基础包。大多数计算包都提供了基于Numpy的科学函数功能,将Numpy的数组对象作为数据交换的通过语。Numpy特点提供高效多维...原创 2020-04-26 22:15:13 · 1197 阅读 · 4 评论 -
Matplotlib介绍与安装
3- Matplotlib介绍与安装3-1 Matplotlib介绍和安装Matplotlib介绍什么是Matplotlib?Matplotlib是一个Python的绘图库,它可与Numpy一起使用,可以代替Matlab使用为什么要学习Matplotlib?将数据进行可视化,使数据更直观。使数据更加更具有说服力Matplotlib安装 pip install M...原创 2020-04-25 14:58:39 · 912 阅读 · 0 评论 -
Numpy常用的数据清洗函数
排序函数np.sort将元素进行小到大的顺序排序axis-1默认情况下为-1,当为-1的时候是进行小到大排序0当为0的时候,是进行列的方式进行操作(从小到大)1当为1的时候,是进行行的方式进行操作(从小到大的顺序)np.argsort将元素进行小到大的顺序排序(但返回的结果为元素对应的索引值)数据的搜索np.where意思:条件筛选语句语法:condition, x=...原创 2020-02-03 11:22:32 · 674 阅读 · 0 评论 -
Numpy常用的数据结构
numpy安装pip install numpynumpy底层是使用C语言来实现运算的效果非常高数据清洗的意义现实生活中,数据并非完美,需要进行清洗才能进行后面的数据分析数据清洗是整个数据分析项目最消耗时间的一步数据的质量最终决定了数据分析的准确性数据清洗是唯一可以提高数据质量的方法,使得数据分析的结果也变得更加可靠数据清洗常用工具目前在Python中,numpy和pand...原创 2020-02-02 10:17:47 · 1914 阅读 · 0 评论 -
数据分析介绍与环境安装
数据分析介绍数据分析的基本概念用适当的统计分析方法对数据收集来的大量数据进行分析提取有用信息和形成结论对数据加以详细研究和概括总结的过程数据分析的流程明确目的准备数据数据解析分析数据获得结论成果可视化数据分析和数据挖掘的相似之处数据挖掘和数据分析都是对数据进行分析、处理等操作,从而得到有价值的知识数据分析与数据挖掘的区别在应用工具上,数据分析更多的是借助...原创 2020-04-08 16:45:15 · 364 阅读 · 0 评论