python pandas的简单用法

最新推荐文章于 2024-04-13 11:47:16 发布

Jumin_Noki

最新推荐文章于 2024-04-13 11:47:16 发布

阅读量211

点赞数

分类专栏： pandas 文章标签： pandas 大数据

本文链接：https://blog.csdn.net/Jumin_Noki/article/details/116129432

版权

pandas 专栏收录该内容

1 篇文章

订阅专栏

本文介绍 Python 中 Pandas 库的基本用法，包括数据导入、查看和处理等操作。Pandas 是进行数据分析和挖掘的重要工具，提供了高效的数据处理方法。

摘要由CSDN通过智能技术生成

对于数据科学家，无论是数据分析还是数据挖掘来说，Pandas是一个非常重要的Python包。它不仅提供了很多方法，使得数据处理非常简单，同时在数据处理速度上也做了很多优化，使得和Python内置方法相比时有了很大的优势

用法：

pd.read_csv(filename)：从CSV文件导入数据
pd.read_table(filename)：从限定分隔符的文本文件导入数据
pd.read_excel(filename)：从Excel文件导入数据
pd.read_sql(query, connection_object)：从SQL表/库导入数据
pd.read_json(json_string)：从JSON格式的字符串导入数据
pd.read_html(url)：解析URL、字符串或者HTML文件，抽取其中的tables表格
pd.read_clipboard()：从你的粘贴板获取内容，并传给read_table()
pd.DataFrame(dict)：从字典对象导入数据，Key是列名，Value是数据

查看、检查数据

df：任意的Pandas DataFrame对象【比如pd的返回值】

s：任意的Pandas Series对象

df.head(n)：查看DataFrame对象的前n行
df.tail(n)：查看DataFrame对象的最后n行
df.shape()：查看行数和列数
df.info()：查看索引、数据类型和内存信息
df.describe()：查看数值型列的汇总统计 s.
s.value_counts(dropna=False)：查看Series对象的唯一值和计数
df.apply(pd.Series.value_counts)：查看DataFrame对象中每一列的唯一值和计数
df.dropna()#删除包含缺失值的行
df[["a","b"]] #直接取出对应a ,b的列数据
df.iloc：切位置,以序列号去切 df.iloc[:10]


import pandas as pd
RAW_DATA_DIR = 'data_raw/'
##将一个或多个路径正确地连接起来
sample_tsv_path = os.path.join(RAW_DATA_DIR, 'normal_1/airsim_rec.txt')
#读取数据
sample_tsv = pd.read_csv(sample_tsv_path, sep='\t')
#查看数据
sample_tsv.head()