rz.csv python简单的数据清洗

最新推荐文章于 2024-06-13 17:46:18 发布

风·吹້໌ᮨ

最新推荐文章于 2024-06-13 17:46:18 发布

阅读量206

点赞数

文章标签： python

本文链接：https://blog.csdn.net/w11864882596/article/details/109081649

版权

本文通过一个实际的rz.csv文件，详细讲解如何使用Python进行数据清洗，包括处理缺失值、异常值和重复数据，同时介绍pandas库在数据预处理中的重要作用。

摘要由CSDN通过智能技术生成

import pandas as pd
df = pd.read_excel('C:/Users/Administrator/Desktop/rz.xlsx')
print(df[df.duplicated()])
df1=df.drop_duplicates()
print(df1.shape)
print(df1.isnull().any())  #缩小控制范围
print(df1[df1.isnull().values==True])
df2 =df1.fillna(0)   #填充空值

df0 = df2.copy()#拷贝数据  比如把解几这行处理掉   df0=df2[:]
df0['解几'] = df2['解几'].astype(str).map(str.strip)
df0.columns=['id','grade','name'

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

风·吹້໌ᮨ

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

python 数据清洗 csv 分隔符_python数据清洗

weixin_39911998的博客

02-19

994

数据的质量直接关乎最后数据分析出来的结果，如果数据有错误，在计算和统计后，结果也会有误。所以在进行数据分析前，我们必须对数据进行清洗。需要考虑数据是否需要修改、如何修改调整才能适用于之后的计算和分析等。数据清洗也是一个迭代的过程，实际项目中可能需要不止一次地执行这些清洗操作。缺省参数 nan将元素只为None 则显示为缺省参数NaN# 读取数据file = './data/a.csv''''AA...

python数据清洗

07-22

本资源部分参考《干净的数据 ——数据清洗入门与实践》，但更多的都是个人撰写。

1 条评论您还未登录，请先登录后发表或查看评论

学习笔记(05):Python数据清洗实战-csv文件读写

01-20

数据清洗之文件操作读取：csv文件实用read_csv方法读写，结果为dataframe格式读写csv文件，文件名称用英文参数较多，可以自行控制，很多使用默认参数读csv，常用编码utf-8,gbk,gbk2312,gb18030 实用to_csv快速保存 import numpy as np import pandas as pd #便于更改文件路径 import os #假如默认的路径下有一ex.csv文件 fd_data = pd.read_csv(‘ex.csv’) fd_data.head() #默认得到前5行 fd_data.info() #查看字段类型 #dis

Python数据清洗

m0_53317797的博客

09-15

3631

a利用python的pandas库以及numpy库实现对animal.csv，泰坦尼克号数据集计算生还比例，商品的信息（价格，成交量，卖家位置）的操作

python数据清洗（二）

热门推荐

小小鹿luby的博客

12-07

1万+

第二部分整理数据进行分析 1、识别整洁的数据要使数据整洁，它必须具有：（1）每个变量作为单独的列。（2）每行作为单独的观察。作为数据科学家，将遇到以各种不同方式表示的数据，因此在看到数据时能够识别整洁（或不整洁）数据非常重要。请注意，df2的变量列包含值Solar.R，Ozone，Temp和Wind。为了使它整洁，这些应该都在单独的列中，如df1中所示。 2、使用melt重塑...

使用Python进行数据分析——准备阶段之Power Query

weixin_44816928的博客

06-11

2904

Power Query教程一、认识Power Query Power Query,它的中文名称叫做查询编辑器，是当前最新的Excel数据处理工具。它既不是公式也不是语言，而是一个工具插件，这个工具把我们常用的数据提取、清洗、加载等功能制作成傻瓜式的操作界面，让不懂计算机编程语言的人也能够完成一些数据处理的工作，让问题回归到简单与智能当中。 1、使用Excel2016中的Power Query Excel一直以来都是一个强大的数据分析工具，而且式越来越强大。再office2016

POI.zip_POI爬取_R7U_sum3rz_爬取兴趣点_百度poi

07-14

标题中的"POI.zip_POI爬取_R7U_sum3rz_爬取兴趣点_百度poi"揭示了这个压缩包内容的核心，它涉及到一个使用Python进行的百度兴趣点（POI，Points of Interest）数据爬取项目。"R7U_sum3rz"可能是开发者的用户名或者是...

【Udacity项目】TMDb电影数据集探索分析

~ Lily的学习分享 ~

10-28

5600

项目：TMDb电影数据集探索与分析目录简介数据整理探索性数据分析结论附录：参考资料列表简介本项目对包含10,000+条电影信息的数据集进行了探索与分析，围绕电影票房与用户评分、电影类别、演员、制片公司、档期等因素之间的相关性，探究了高票房电影的各种特征。数据来源于"电影数据库”（TMDb，The Movie Database）。项目过程包括数据整理、探索性数据分析、结论三个部...

Python库.20240617

最新发布

lanlingxueyu的博客

06-13

1497

Python库 20240617 更新时间

CSV格式数据清洗附件data.csv

12-22

此文件为Python 123 平台 Python语言程序设计练习7：文件与数据格式化的CSV格式数据清洗附件

使用Python进行数据清洗，以及一些常见的数据清洗技巧和最佳实践

m0_57781768的博客

09-26

8182

首先，让我们了解如何使用Python进行数据统计和摘要。Pandas提供了一些有用的函数来获取数据的摘要统计信息。# 获取数据摘要统计信息# 计算相关系数矩阵。

chatgpt赋能python：Python数据清洗：如何用Python清洗CSV文件数据

shengcaiy123的博客

06-23

1141

本文由chatgpt生成，文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型，只是展现它原本的实力。对于颠覆工作方式的ChatGPT，应该选择拥抱而不是抗拒，未来属于“会用”AI的人。🧡AI职场汇报智能办公文案写作效率提升教程 🧡专注于AI+职场+办公方向。下图是课程的整体大纲下图是AI职场汇报智能办公文案写作效率提升教程中用到的ai工具。

pandas知识汇总(超详细)

xiaoqiang616717的博客

04-21

813

首先建立两个表 df = pd.DataFrame({"id":[1001,1002,1003,1004,1005,1006], "date":pd.date_range('20130102', periods=6), "city":['Beijing', 'SH', ' guangzhou ', 'Shenzhen', 'shanghai', 'BEIJING '], "age":[23...

python入门 -文件读写和数据清洗

数据打工人的博客

08-18

1902

python文件读写和数据清洗

python123.io---CSV 格式数据清洗

liiuyizeliuyize的博客

03-14

2368

python123.io---CSV 格式数据清洗

Python之数据处理案例

weixin_45568892的博客

04-06

5964

Python之数据处理案例 1 准备数据 2 要求（1）将数据表添加两列：每位同学的各科成绩总分（score）和每位同学的整体情况（类别），类别按照[df.score.min()-1,400,450,df.score.max()+1]分为“一般” “较好” “优秀”三种情况。（2）由于“军训 ”这门课的成绩与其他科目成绩差异较大，并且给分较为随意，为了避免给同学评定奖学金带来不公平，请将每...

机器学习中数据清洗&预处理入门完整指南

我爱计算机视觉

03-02

1586

点击我爱计算机视觉标星，更快获取CVML新技术本文经机器之心（微信公众号：almosthuman2014）授权转载，禁止二次转载。选自towardsdatascience作者：Anne ...

Python数据清洗实战入门

12-09

本次课程主要以真实的电商数据为基础，通过Python详细的介绍了数据分析中的数据清洗阶段各种技巧和方法。

SELECT rz.DEPT_CODE, rz.VOLT_LEVEL, rz.AR_YEAR, rz.AR_MONTH, ROUND( SUM( CURRENT_ACTUAL_RECORD_AMOUNT )/ 10000, 4 ) "和" FROM prj_ah_erp_rz_item rz LEFT JOIN mag_cd_coding c ON rz.VOLT_LEVEL = c.CODE_NAME GROUP BY rz.DEPT_CODE, rz.VOLT_LEVEL

06-03

这是一个SQL查询语句，它的作用是从表prj_ah_erp_rz_item和mag_cd_coding中获取数据，并按照rz.DEPT_CODE和rz.VOLT_LEVEL字段进行分组，然后对每个分组中的CURRENT_ACTUAL_RECORD_AMOUNT字段求和，并将结果除以10000...