python avg函数在哪个模块_python数据处理工具–Pandas模块

最新推荐文章于 2023-08-27 11:34:19 发布

独厨食记

最新推荐文章于 2023-08-27 11:34:19 发布

阅读量1.2k

点赞数

文章标签： python avg函数在哪个模块

本文链接：https://blog.csdn.net/weixin_36179103/article/details/114910299

版权

健壮的数据处理模块Pandas，能够处理数据的预处理作业，如数据类型的转化、缺失值的处理、描绘性核算分析和数据的汇总等一、序列与数据框的结构Pandas模块的中心操作政策为序列和数据框。序列指数据会集的一个字段，数据框为至少含有两apple个字段(或序列)的数据集。1.结构序列经过列表、元祖、Numpy中的一维数组结构序列均如序列1，榜首列为序列的行索引(行号)，主动从0开始；第二列为序列的实践值...

摘要由CSDN通过智能技术生成

健壮的数据处理模块Pandas，能够处理数据的预处理作业，如数据类型的转化、缺失值的处理、描绘性核算分析和数据的汇总等

一、序列与数据框的结构

Pandas模块的中心操作政策为序列和数据框。序列指数据会集的一个字段，数据框为至少含有两apple个字段(或序列)的数据集。

1.结构序列

format,png

经过列表、元祖、Numpy中的一维数组结构序列均如序列1，榜首列为序列的行索引(行号)，主动从0开始；第二列为序列的实践值

经过字典结构不同，榜首列为详细的行称谓，对应字典中的键，第二列为序列的实践值，对应字典中的值。

还能够经过数据框中的某一列构建

2.序列元素的获取

对一维数组的索引办法和数学app装置下载以及核算函数都能够用到序列上，但序列有特有的处理办法。

format,png

对经过字典类型构建的，可用行号，也可用行称谓索引

format,png

假定需求对序列做数学函数核算，首选numpy模块

format,png

假定需求对序列做核算函数核算，首选序列的办法

3.结构数据框

数据框实践是一个数据集，行代表每一条观测，列数据库是什么代表各个变量。在一个数据库中能够寄存不同数据类型的序列，而数组和序列只能寄存同质数据appstore。

format,png

手工数组词结构数据框的话，首选字典办法，因为其他办法结构没有详细的变量名

还能够经过外部数据的读取结构

二、外部数据的python123读取

1.文本文件的读取

运用Pandas中的read_table函数或许read_c数据库办理系统sv函数mysql数据库命令大全

format,png

filep数据库是什么ath_or_b数组指针uffer：指定txt文件或csv文件地址的详细途径；

sep：指定原数据会集各字段之间的分隔符，默许为Tab制表符；

header：是否需求将原数据会集的榜首行作为表头，默许将榜首行用作字段称谓；

names：假定原数据会集没有字段，能够经过该参数在数据读取时给数据框增加详细的表头；

index_col：指定原数据会集的某些列作为数据框的行索引(标签)；

usecols：指定需求读取原数据会集的哪些变量名；python能够做什么作业

dtype：读取数据时，能够为原数据集的每个字段设置不同的数据类型；

conve数组rters：经过字典格式，为数据会集的某些字段设置转化函数

ski数据库工程师prows：数据读取时，指定需求越过原数据集开始的行数；

skipfooter：数据读取python为什么叫爬虫时，指定需求越过原数据集结束的行数；

nrows：指定读取数据的行数；

na_values：指定原数据会集哪些特征的值作为缺失值；

skip数组公式_blank_lines：读python培训班膏火一般多少取数据时是否需求越过原数据会集的空白行，默许为True；

parse_dates：假定参数值为True，则检验解析数据框的行索引；假定参数为列表，则检验解析对应的日期列；假定参数为嵌套列表，则将某些列吞并为日期列；假定参数为字典，则解析对应的列(即app装置下载字典中的值)，并生成新的字段名(即字典中的键)；

thousands：指定原始数据会集的千分位符；

comment：指定注释符，在读取数据时，假定碰到行首指定的注释符，则越过改行；

encoding：假定文件中含有中文，有时需求指定字符编码；

format,png

a=pd.read_table("F:第5章 Python数据处理东西--数组指针Pandas第五章 Python数据处理东西-python123-Pandasdata_test01.txt",sep=",",skiprows=2,skipfooter=3,comme数组nt="#",encoding="utf8",thousands="&",parse_dates={"birthday":[0,1,2]})Python

format,png

原数据集数组去重用逗号分隔每一列，则改动sep参数，吞并新字段bir数据库软件thday，comment参数指定越过的特别行，含有中文的从头编码，千分位符为了确保数值型数据的正常读入

2.电子表格python需求什么根底的读取

运用read_excel函数

format,png

io：指定电子表格的详细途径；

sheetname：指定需求读取电子表格中的第几个She数据库索引et，能够传递整数也能够传递详细的Sheet称谓；

header：是否需求将数据集的榜首行用作表头，默许数组公式为是需求的；

skiprows：读取数据时，指定越过的开始行数；

skip_footer：读取数据是，指定越过的结束行数；

index_col：指定哪些列用作数据框的mysql是什么软件行索引(appreciate标签)；

names：假定原数据会集没有字段，能够经过该参数在数据读取时给数据框增加详细的表头；

parse_cols：指定需求解析的字python需求什么根底段；

parse_dates：假定参数值为True，则检验解析数据框的行索引；假定参数为列表，则检验解析对应的日期列；假定参数为嵌套列表，则将某些列吞并为日期列；假定appearance参数为字典，则解析对应的列(即字典中的值appstore)，并生成新的字段名(即字典中的键)；

na_values：指定原始数据中数据库系统的中心是哪些特别值代表了缺失值；

thousands：指定数组原始数据mysql面试题会集的千分位符；

convert_float：默许将全部的数值型字段转化为浮点型字段；

converters：经过字典的办法，指定某python123些列需求转化的办法；

format,png

b=pd.read_excel(io="F:第5章 Python数据处理东西--Pandas第五章 Python数据处理东西--Pandasdata_test02.xmysql优化lsx",header=None,converters={0:str},names=['ID',mysql8.0装置教程"name数组指针",'color',"price"])

format,png

关于榜首列，实践上是字符型，为了防止数据读入时主动变成数值型字段Python，数据库需求用converts参数

3.数据库数据的读取

需求先经过cmd命令输app装置下载入pip instal数据库索引l pymysql或许pysmsql(别离mysql装置装备教程对应MYSQL和SQL Server)

CASE1：pymysql中的connect

format,png

host：指定需求拜访的MySQL服务器；

user：指定拜访MySQL数据库的用户名；

password：指定拜访MySQL数据库的暗码；

data数据库是什么base：指定拜访MySQL数据库的详细库名；

port：指定拜访MySQL数据库的端口号；

charset：指定读取MySQL数据库的字符集，假定数据库表中含有中文，一般能够检验将该参数设置数据库系统工程师为“utf8”或“gbk”；

CASE2：pymssql中的connect

参数意义也是一起的，所不同的是p数据库工程师ymysql模块中connect函数的host参数标明需求拜访的服务器，而pymssql函数中对应的参数是server

以MYSQL举例：

format,png

# 读入

最低0.47元/天解锁文章

独厨食记

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
python avg函数在哪个模块_python数据处理工具–Pandas模块

健壮的数据处理模块Pandas，能够处理数据的预处理作业，如数据类型的转化、缺失值的处理、描绘性核算分析和数据的汇总等一、序列与数据框的结构Pandas模块的中心操作政策为序列和数据框。序列指数据会集的一个字段，数据框为至少含有两apple个字段(或序列)的数据集。1.结构序列经过列表、元祖、Numpy中的一维数组结构序列均如序列1，榜首列为序列的行索引(行号)，主动从0开始；第二列为序列的实践值...
复制链接

扫一扫