![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
pandas
文章平均质量分 84
龙技术
一篇诗,一斗酒,一曲长歌,一剑天涯
展开
-
pandas多场景业务实战-指标计算
指标计算学习目标掌握数据指标的概念知道常见的业务指标含义掌握常用数据指标计算方法 在之前的课程中,我们学习了Excel, Tableau, SQL, Python, 机器学习,它们都属于数据分析要用到的工具,接下来我们就要结合业务场景,综合运用这些工具,来完成一些具体任务。 数据分析/大数据分析的目的是为了用数据驱动运营,用数据驱动业务增长(数据驱动设计,数据驱动决策,数据驱动XXX……),我们之前也提到过数据分析的几个层次,描述性分析→诊断性分析→预测分析→规范分析。要做到数据驱原创 2021-09-12 20:06:49 · 1022 阅读 · 0 评论 -
pandas Pyecharts绘图
Echarts和Pyecharts学习目标掌握pyecharts绘图1 Echarts 和 Pyecharts简介Echarts简介ECharts 是一个使用 JavaScript 实现的开源可视化库,涵盖各行业图表,满足各种需求。ECharts 遵循 Apache-2.0 开源协议,免费商用,百度出品。ECharts 兼容当前绝大部分浏览器(IE8/9/10/11,Chrome,Firefox,Safari等)及兼容多种设备,可随时随地任性展示。pyecharts简介pyech原创 2021-09-06 08:00:00 · 584 阅读 · 0 评论 -
pandas Seaborn绘图
Seaborn可视化学习目标掌握seaborn的可视化绘图方法1 Seaborn简介Seaborn是基于matplotlib的图形可视化python包。它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn能做出很具有吸引力的图,而使用matplotlib就能制作具有更多特色的图。Seaborn和Pandas的API配合的很好,使用DataFrame/原创 2021-09-06 07:58:47 · 418 阅读 · 0 评论 -
pandas pandas绘图
Pandas绘图学习目标熟练掌握Pandas数据可视化常用功能1 Pandas数据可视化简介pandas库是Python数据分析的核心库它不仅可以加载和转换数据,还可以做更多的事情:它还可以可视化pandas绘图API简单易用,是pandas流行的重要原因之一2 Pandas 单变量可视化单变量可视化, 包括条形图、折线图、直方图、饼图等数据使用葡萄酒评论数据集, 来自葡萄酒爱好者杂志(wineEnthusiast),包含10个字段,150929行,每一行代表一款葡萄酒原创 2021-09-03 20:44:56 · 388 阅读 · 0 评论 -
pandas Matplotlib绘图
Python数据可视化学习目标知道数据可视化的相关概念知道Python数据可视化常用库和各自特点应用Matplotlib,pandas,Seaborn进行数据可视化了解echarts和pyecharts应用pyechars绘图1 数据可视化简介1.1 数据可视化概念数据可视化是指直观展现数据,它是数据处理过程的一部分。把数值绘制出来更方便比较。借助数据可视化,能更直观地理解数据,这是直接查看数据表做不到的数据可视化有助于揭示数据中隐藏的模式,数据分析时可以利用这些模式选择模型原创 2021-09-03 20:41:58 · 272 阅读 · 0 评论 -
pandas datetime数据类型
datetime 数据类型学习目标应用Pandas来处理日期时间类型数据1 Python的datetime对象Python内置了datetime对象,可以在datetime库中找到from datetime import datetimenow = datetime.now()now显示结果:datetime.datetime(2020, 6, 17, 19, 47, 56, 965416)还可以手动创建datetimet1 = datetime.now()t2原创 2021-09-03 20:38:28 · 2739 阅读 · 0 评论 -
pandas 数据透视表
**我们可以使用df.pivot_table() ,来实现同样的功能,参数如下index:行索引,传入原始数据的列名columns:列索引,传入原始数据的列名values: 要做聚合操作的列名aggfunc:聚合函数**数据透视表学习目标知道什么是透视表掌握Pandas透视表(pivot_table)的使用方法1 Pandas 透视表概述透视表是一种可以对数据动态排布并且分类汇总的表格格式。或许大多数人都在Excel使用过数据透视表,也体会到它的强大功能,而在pandas中它被原创 2021-09-01 20:31:26 · 8005 阅读 · 2 评论 -
pandas 数据分组
分组操作学习目标应用groupby 进行分组,并对分组数据进行聚合,转换和过滤应用自定义函数处理分组之后的数据1 aggregate聚合在SQL中我们经常使用 GROUP BY 将某个字段,按不同的取值进行分组, 在pandas中也有groupby函数分组之后,每组都会有至少1条数据, 将这些数据进一步处理返回单个值的过程就是聚合,比如 分组之后计算算术平均值, 或者分组之后计算频数,都属于聚合1.1 单变量分组聚合需求:加载data/gapminder数据集,计算每一年的平原创 2021-09-01 20:29:40 · 1760 阅读 · 0 评论 -
pandas 数据类型及相互转化
Pandas 数据类型学习目标了解Numpy的特点应用Pandas 数据类型转换掌握Pandas 分类数据类型使用方法1 Pandas数据类型简介1.1 Numpy 介绍Numpy(Numerical Python)是一个开源的Python科学计算库,用于快速处理任意维度的数组。Numpy支持常见的数组和矩阵操作。对于同样的数值计算任务,使用Numpy比直接使用Python要简洁的多。Numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器。比如我们原创 2021-08-31 20:40:07 · 6374 阅读 · 0 评论 -
pandas 数据整理(转置)
整理数据学习目标掌握melt函数整理数据的方法掌握stack、unstack的用法掌握wide_to_long函数的用法1 melt整理数据1.1 宽数据集变为长数据集加载美国收入与宗教信仰数据import pandas as pdpew = pd.read_csv('data/pew.csv')pew# 输出结果如下图[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-M9AL0Mxo-1630413533985)(./img/整理数据-01.p原创 2021-08-31 20:39:00 · 1631 阅读 · 0 评论 -
pandas缺失数据处理
缺失数据处理学习目标知道什么是缺失值,为什么会产生缺失值熟练掌握缺失值处理的方式1 NaN简介好多数据集都含缺失数据。缺失数据有多重表现形式数据库中,缺失数据表示为NULL在某些编程语言中用NA或None表示缺失值也可能是空字符串''或数值 0在Pandas中使用NaN表示缺失值Pandas中的NaN值来自NumPy库,NumPy中缺失值有几种表示形式:NaN,NAN,nan,他们都一样缺失值和其它类型的数据不同,它毫无意义,NaN不等于0,也不等于空字符串fr原创 2021-08-31 20:37:41 · 2727 阅读 · 0 评论 -
pandas 数据清洗(数据组合)
数据组合2.1.1 concat【重点】pandas函数,pd.concat()既可以纵向连接(默认,axis=0或者axis=‘index’)也可以横向连接(axis=1或者axis=‘columns’)可以连接多个对象(多个df)纵向连接:N个df从上到下一个摞一个默认外连接(join=‘outer’),列名相同的数据会合并到一列,列名不同的数据用NaN填充内连接(join=‘inner’),只保留数据中共有的部分横向连接:N个df从左到右一个挨着一个默认外连原创 2021-08-30 20:57:57 · 395 阅读 · 0 评论 -
Pandas数据分析入门
describe() 【知道】默认打印数据值列统计描述打印非数值列统计描述import numpy as npdf.describe(include=[np.object, pd.Categorical])# np.object 字符串类型# pd.Categorical dataframe特有的类别类型info() 【知道】返回所有字段的条目数量、数据类型、是否缺失,及当前数据集整体的内存占用情况常用排序方法nlargest() 【知道】df.nla..原创 2021-08-30 20:57:02 · 408 阅读 · 0 评论 -
pandas 数据的存入和导出(数据库及文件)
导出导入数据【重要】导入加载数据pd.read_xxx('文件路径') # 常用方法 read_csv(),read_excel()# 加载mysql数据库数据# 方法一:用DBAPI构建数据库链接engineimport pandas as pdimport pymysqlconn = pymysql.connect(host='localhost', user='root', passwor原创 2021-08-30 20:52:24 · 1361 阅读 · 0 评论 -
pandas 数据结构
Series常用操作【知道】Series创建:传入一个Python列表如果传入的数据类型是统一的数字,那么最终的dtype类型是int64如果传入的数据类型是统一的字符串,那么最终的dtype类型是object如果传入的数据类型是多种类型,那么最终的dtype类型也是object# data=,传入要python列表;index=指定行索引,不传的话行索引默认为0,1,2...pd.Series(data=,index=)# 例子1s = pd.Series(['banana',原创 2021-08-30 20:46:02 · 138 阅读 · 0 评论 -
pandas的DataFrame
认识DataFrame数据对象导入pandas包:import pandas as pd加载读取文件:加载CSV文件df=pd.read_csv('data/movie.csv')#加载movie.csv文件df.head()#展示前5条数据加载tsv文件# 参数1 要加载的文件路径,参数2 sep传入分隔符,默认是',' '\t'制表符df=pd.read_csv('data/gapminder.tsv',sep='\t')print(df)查看部分数原创 2021-08-28 20:13:34 · 534 阅读 · 0 评论 -
Anaconda的操作
Anaconda的操作:命令行终端对虚拟环境的操作命令如下:创建虚拟环境:conda create -n 虚拟环境名字 python=3.8进入虚拟环境:conda activate 虚拟环境名字退出虚拟环境:conda deactivate删除虚拟环境:conda remove -n 虚拟环境名字 --all查看虚拟环境:conda env list安装第三方的包:pip install 包名字安装其他包速度慢可以指定国内镜像# 阿里云:https://mirrors.al原创 2021-08-28 20:06:11 · 76 阅读 · 0 评论