学习笔记(06):Python数据清洗实战-数据筛选

最新推荐文章于 2024-05-02 11:19:24 发布

ursjing

最新推荐文章于 2024-05-02 11:19:24 发布

阅读量889

点赞数

分类专栏：研发管理文章标签：数据编程语言 Python python 数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ursjing/article/details/104290506

版权

立即学习:https://edu.csdn.net/course/play/26990/361123?utm_source=blogtoedu

数据筛选：直接引用，选择行列，基础索引，loc和iloc，如何区分

import三个库：pandas as pd，os， numpy as np

os.chdir(‘数据存放路径’)

读取变量 = pd.read_csv(‘文件名称’， encoding=‘’，dtype= {‘某一列名’：str})

df.info（）对数据进行简单的探索，比如多少行，多少变量，每个column数据类型等

df.head () 查看下数据前几行是什么样子的

df.columns 是数据的列名称，也叫变量名称或者叫数据的字段

如果只想要一列，简单索引方式：df【‘列名’】但是如果要两列，就要以嵌套列表的形式df[[‘列名1’,’列名2’]].head(5)这里是显示前五行的意思。取多个字段要写两层。如果只想要第二行到第五行就[1:5]这里是左闭右开，因此是包含1但不包含5，第二行到第五行

loc只能选标签，比如loc[3:4]就会把索引标签为3的和索引标签为4的给取出来，loc定义的是标签，也就是这里的3和4不再是位置而是标签了

如果不想选择行但是想选择列，并以列表形式传递进去。则：

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
学习笔记(06):Python数据清洗实战-数据筛选

本次课程主要以真实的电商数据为基础，通过Python详细的介绍了数据分析中的数据清洗阶段各种技巧和方法。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。