【Python】【Pandas】数据处理

陈SIRCHEN

已于 2022-04-21 09:00:26 修改

阅读量2.1k

点赞数

分类专栏： Python 文章标签： python 机器学习

于 2022-03-15 11:58:16 首次发布

本文链接：https://blog.csdn.net/m0_51947431/article/details/123499103

版权

Python 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

一数据获取

1.1 读取文件

import pandas as pd

1.1.1 csv

data = pd.read_csv('/路径')

函数	参数列表
.iloc	[ : , : ]	分割行列
.sample	( n , random_state )	随机采样
.drop	( labels=[‘列名’] , axis=1/0 )	去除行/列

1.1.1 txt

data = pd.read_table('1.txt',header=None, encoding='gb2312', sep=' ')

1.2 自定数据

pd.DataFrame({'列名A':[1,2],'列名B':[4,3]},index = [1,2])

二数据查看

2.1

函数名	实现功能
.info()	基本信息
.head(n)	查看前 n 条
.tail(n)	查看后 n 条
.shape	形状
.values	以数组形式获取内容

三数据处理

3.1 归一化

3.1.1 整体列归一化

占位

3.1.2 列归一化

from sklearn.preprocessing import StandardScaler
data['列名'] = StandardScaler().fit_transform(data['列名'].values.reshape(-1,1))

3.2 筛选

data_normal = data[data['列名'] == '值0']
data_normal = data[data['列名'] == '值1']

四保存

4.1 数据库保存

4.2 文件保存

4.2.1 保存成csv

data.to_csv("2.csv")

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

陈SIRCHEN

关注关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【Python】【Pandas】数据处理

一数据读取import pandas as pddata = pd.read_csv(r'/')二数据处理2.1 筛选data_normal = data[data['Class'] == 1]
复制链接

扫一扫

专栏目录

【Python 数据处理】Pandas

小西几

04-20

3184

Pandas 是 Python 语言的一个扩展程序库，用于数据分析。 Pandas 名字衍生自术语 "panel data"（面板数据）和 "Python data analysis"（Python 数据分析）。 Pandas 一个强大的分析结构化数据的工具集，基础是Numpy（提供高性能的矩阵运算）。一、Pandas Series——基础数据类型 Series是一种类似于一维数组的对象，它由一组数据data（各种Numpy数据类型）以及一组与之相关的数据标签（即索引）index组成。 Se..

【Python】Pandas入门（Series、DataFrame）

○( ＾皿＾)っHiahiahia…的博客

03-23

317

内容来源中国大学MOOC 《Python数据分析与展示（嵩天）》单元7: Pandas库入门推荐大家直接去看视频！ Series的生成 Series类型可以由如下类型创建: (1)Python列表, index与列表元素个数一致 (2)标量值，index表达Series类型的尺寸 (3)Python字典,键值对中的"键”是索引, index从字典中进行选择操作 (4)ndarray ,索引和数...

参与评论您还未登录，请先登录后发表或查看评论

Pandas 之DataFrame二维表基础

qq_42419985的博客

03-14

2567

1、DataFrame的创建 DataFrame是一种表格型数据结构，它含有一组有序的列，每列可以是不同的值。DataFrame既有行索引，也有列索引，它可以看作是由Series组成的字典，不过这些Series公用一个索引。 DataFrame的创建有多种方式，不过最重要的还是根据dict进行创建，以及读取csv或者txt文件来创建。这里主要介绍这两...

使用Pandas完成data列数据处理，按照数据列中元素出现的先后顺序进行分组排列...

小詹学python的博客

10-30

455

一、前言前几天在Python钻石交流群【瑜亮老师】给大家出了一道Pandas数据处理题目，使用Pandas完成下面的数据操作：把data列中的元素，按照它们出现的先后顺序进行分组排列，结果如new列中展示。df打印结果展示如下：。下面是原始内容。importpandasaspd df=pd.DataFrame({ 'data':['A1','D3','B2','C4',...

12个用于Python数据操作的Pandas技巧（附代码）_python pandas 操作

热门推荐

qq_42902997的博客

07-09

4万+

文章目录1. data.loc[index,column]2. data[column][index] 1. data.loc[index,column] 使用.loc[ ]第一个参数是行索引，第二个参数是列索引 import pandas as pd data = pd.DataFrame([range(1,5),range(6,10),range(11,15)]) print(data) dt = data.loc[0,1] //[index,column] print(dt) 相当于第0行第1列

Pandas基本常用操作

zswdhy的博客

09-16

1460

pandas 基本操作汇总

Python pandas 数据清洗基础教程

01-15

本教程为您介绍了 Python pandas 的数据清洗基础知识，包括数据处理顺序、Pandas 库简介、Pandas 索引和选择数据、Pandas 数据统计和聚合、Pandas 数据缺失值处理、Pandas 数据可视化和数据探索分析。

使用Python Pandas处理亿级数据的方法

01-20

这次拿到近亿条日志数据，千万级数据已经是关系型数据库的查询分析瓶颈，之前使用过Hadoop对大量文本进行分类，这次决定采用Python来处理数据：硬件环境 CPU：3.5 GHz Intel Core i7 内存：32 GB HDDR 3 1600 MHz...

《Python数据分析与应用》教学课件04pandas数据处理.pdf

06-22

《Python数据分析与应用》教学课件04pandas数据处理.pdf《Python数据分析与应用》教学课件04pandas数据处理.pdf《Python数据分析与应用》教学课件04pandas数据处理.pdf《Python数据分析与应用》教学课件04pandas数据...

Pandas高级处理（缺失值、数据离散化、数据合并、交叉表透视表、分组与聚合）

m0_47482052的博客

01-03

688

Pandas高级处理（缺失值、数据离散化、数据合并、交叉表透视表、分组与聚合）

Python：利用Pandas读取数据、查询指定条件的数据、以及数据的详细信息

Junehhhhh的博客

02-25

1万+

在Python中，如何利用Pandas去读取数据、查询指定条件的数据、以及获取数据的详细信息.

data pandas包应用

m0_56552415的博客

11-04

505

## 日期时间处理和单极索引处理首先先导包 import pandas as pd data = pd.read_csv('D:/city_temperature.csv',dtype= {'State':object}) 如果直接用数组访问方式会有数据类型不匹配的问题因为数据集的年月日都是int类型，你和一个字符相加不能拼接 data['Date'] = data['Year'].astype(str) + '/' + data['Month'].astype(str).

python read csv thousand_python读写数据读写csv文件(pandas用法)

weixin_39689870的博客

12-15

885

python中数据处理是比较方便的，经常用的就是读写文件，提取数据等，本博客主要介绍其中的一些用法。Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。一、pandas读取csv文件数据处理过程中csv文件用的比较多。import pandas as pddata = pd.read_csv('F:/Zh...

python pandas 时间序列数据

侯小啾技术博客

06-23

903

python pandas 时间序列数据1. to_datetime() “字符串序列”转时间序列使用datetime对象序列得到时间序列数据 pd.date_range() 创建时间序列数据创建方法① 指定periods 创建方法② 指定首位创建方法③ 指定频率 freq 时间的索引索引取个别数据索引年份索引年月切片支持`[start:end:step]`切片切片(包含末端数据) 通过切片修改数据 truncate() 截断函数时间序列中的空日期空值日期的形式判断空值...

python pandas 日期_Python Pandas数据中对时间的操作

weixin_39830020的博客

12-04

285

Pandas中对时间这个属性的处理有非常非常多的操作。而本文对其中一个大家可能比较陌生的方法进行讲解。其他的我会陆续上传。应用情景是这样的：考虑到有一个数据集，数据集中有用户注册账号的时间(年-月-日)，如下图格式。如果我们希望对用户账号注册时间转为具体的天数，我们可以用如下代码。import pandas as pdtd=data['user_reg_tm']Time=pd.to_datet...

python中pandas

jiasudu1234的博客

04-01

1314

import pandas as pd bj=pd.Series([4,7,-5,3])#产生带索引的一维数组 bj.values#返回数组值 bj.index#返回下表 bj1=pd.Series([4,7,-5,3],index=['a','b','c','d'])#自定义索引 bj1['a']#通过索引查找值 bj1[['a','c']]#通过索引查找值，建立子集 bj>2#逻

python pandas 数据处理

09-14

关于Python中的Pandas库进行数据处理，我可以为您提供一些基本的指导和示例。Pandas是一个强大的数据分析工具，它提供了灵活且高效的数据结构，以及用于处理和操作数据的函数。首先，您需要确保已经安装了Pandas库...

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交