学习笔记(05):Python数据清洗实战-csv文件读写

最新推荐文章于 2024-08-05 23:12:28 发布

这么多圆圈圈

最新推荐文章于 2024-08-05 23:12:28 发布

阅读量1.6k

点赞数 1

分类专栏：研发管理文章标签：数据编程语言 Python python 数据分析

本文链接：https://blog.csdn.net/erlihan/article/details/104418435

版权

研发管理专栏收录该内容

14 篇文章 0 订阅

订阅专栏

数据清洗之文件操作

读取：csv文件

实用read_csv方法读写，结果为dataframe格式
读写csv文件，文件名称用英文
参数较多，可以自行控制，很多使用默认参数
读csv，常用编码utf-8,gbk,gbk2312,gb18030
实用to_csv快速保存

import numpy as np

import pandas as pd

#便于更改文件路径

import os

#假如默认的路径下有一ex.csv文件

fd_data = pd.read_csv('ex.csv’)

fd_data.head() #默认得到前5行

fd_data.info() #查看字段类型

#display.max_columns和display.max_rows是为了解决列数或行数过多显示不全的问题

pd.set_option('display.max_columns',5)

pd.set_option('display.max_rows',5)

#指定读取的行数，nrows是为了自定义读取的行数，比如需要看一个大文档的前多少行

fd_data = pd.read_csv('ex.csv',nrows=5)

#将处理好的fd_data保存为csv文件。默认就是utf-8,index=false表示不把行索引保留到csv文件中去。

fd_data.to_csv('f.csv',encoding='utf-8',index = False)

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

这么多圆圈圈

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

csv文件数据清洗

dongjiaowei5004的博客

08-04

3868

一、需求：对爬取的csv文件进行数据清洗 运用内容：pandas、正则表达式二、简单分析：共176条数据其中，分析目标以全职为准，但职位名称包含实习信息，需要删除掉。数据方面：csv保存格式为str，运用正则表达式提取数值工作经验去平均值，工资按市场情况，取工资范围前25%。三、代码： import pandas as pd df = p...

python数据清洗---实战案例（清洗csv文件）

最新发布

大剑师兰特的GIS世界

08-05

1859

CSV（Comma-Separated Values）是一种常用的数据交换格式，它以纯文本形式存储表格数据。CSV 文件中的每行通常表示一个数据记录，而每个记录由若干字段组成，字段之间使用逗号分隔。

python学习笔记(关于CSV文件的数据清洗）

qq_43350424的博客

01-18

6271

1、读取CSV文件 data = pd.read_csv(r'.\') 2、看数据大致情况 data.info() 3、当表很大的时候想看表长什么样子 data.head(n)#显示前n行 4、删除表的若干列 data.trop(['aaa','bbb','ccc'],inplace = True,axis = 1)#删除表头为aaa,bbb,ccc的列，inplace = True并用后来的表去覆盖前面的表 5、用均值填补缺失值 data['age'] = data['age'].fillna(d

Python应用：基于CSV文件的建表和数据清洗

dlmyang的博客

04-27

1063

后来数据量变大，excel加载都比较困难，动不动就崩，且excel对长数字不友好，不是被转换成科学记数法，就是后几位变成0，每次碰到这样的问题还得单个处理，很是耗时。在这个脚本中，你首先为表名添加了双引号（这是Oracle数据库的要求），然后为每列生成了相应的列定义。数据库我选择了DM8，它在功能性、友好性、安全性、拓展性上表现均不俗，有人说它是Oracel的国产化替代产品，就用户体验来说，确是如此。对于NaN和'.0'的替换，你可能需要首先确定每列的数据类型，然后只对字符串类型的列进行替换。

学习笔记(06):Python数据清洗实战-csv文件读写

weixin_46282808的博客

02-07

186

本次课程主要以真实的电商数据为基础，通过Python详细的介绍了数据分析中的数据清洗阶段各种技巧和方法。

05-python-sys模块简介-与操作系统进行交互-CSV文件和CSV模块-正则表达式

02-09

Python的csv模块提供了读写CSV文件的功能，包括创建、读取、写入和遍历CSV文件中的行。例如，`csv.reader()`和`csv.writer()`分别用于读取和写入CSV文件，而`csv.DictReader()`和`csv.DictWriter()`则允许你以字典的...

Python学习笔记——csv/excel文件读写&保存

12-21

Python的`csv`库适合简单的CSV文件操作，而`pandas`库提供了更高级的功能，如数据清洗、分析和转换。在实际项目中，根据需求选择合适的方法进行文件读写。对于大型、复杂的数据处理，推荐使用`pandas`，因为它提供了...

python数据清洗学习笔记--文件读写

高雅的博客

04-02

603

python数据清洗–文件读写 目录python数据清洗--文件读写csv文件读写：excel文件读写：数据库文件的读写：创建连接数据保存：前期准备： #导入os模块 import os #获得当前路径地址 os.getcwd() # 更改文件路劲 os.chdir('F:\python\数据清洗\代码和数据') #设置最大显示列数 pd.set_option('display....

第7周 CSV格式数据清洗

weixin_52120741的博客

07-05

5823

chatgpt赋能python：Python数据清洗：如何用Python清洗CSV文件数据

shengcaiy123的博客

06-23

1124

本文由chatgpt生成，文章没有在chatgpt生成的基础上进行任何的修改。以上只是chatgpt能力的冰山一角。作为通用的Aigc大模型，只是展现它原本的实力。对于颠覆工作方式的ChatGPT，应该选择拥抱而不是抗拒，未来属于“会用”AI的人。🧡AI职场汇报智能办公文案写作效率提升教程 🧡专注于AI+职场+办公方向。下图是课程的整体大纲下图是AI职场汇报智能办公文案写作效率提升教程中用到的ai工具。

学习笔记(01):Python数据清洗实战-csv文件读写

weixin_46244754的博客

02-27

238

本次课程主要以真实的电商数据为基础，通过Python详细的介绍了数据分析中的数据清洗阶段各种技巧和方法。

学习笔记（23):Python数据清洗实战入门-csv文件读写

weixin_43504907的博客

09-27

182

本次课程主要以真实的电商数据为基础，通过Python详细的介绍了数据分析中的数据清洗阶段各种技巧和方法。

学习笔记(17):Python数据清洗实战-csv文件读写

qq_43526870的博客

02-10

2177

本次课程主要以真实的电商数据为基础，通过Python详细的介绍了数据分析中的数据清洗阶段各种技巧和方法。

Pandas入门2：CSV文件读写以及数据清洗常用函数介绍

GUNNNNNNN的博客

04-07

1330

可以看出pd.read_csv读取的文件会把什么都没有的单元格忽略，而写有NA或者N/A的数据读取为空值(NaN也可以，而NAN会被认为是有数据的），通过isnull（）判断后会将空值显示为True。Pandas使用 mean()、median() 和 mode() 方法计算列的均值（所有值加起来的平均值）、中位数值（排序后排在中间的数）和众数（出现频率最高的数）。也可以移除指定列有空值的行：(这样就只会在这一行中找空值，找到就删掉这一行，其他行不会找了）输出结果如下：1和2也为空值了。

Python爬虫数据清洗：去除CSV中的【‘‘】

ytpas68453的博客

04-26

1160

CSV，即逗号分隔值（Comma-Separated Values），是一种简单的文件格式，用于存储表格数据，如电子表格或数据库。当Python爬虫从网站上抓取数据并保存到CSV文件中时，有时会出现一些不需要的字符，如【''】。在爬虫抓取数据并保存到CSV文件的过程中，有时会因为网页源代码中的某些特定格式或编码问题，导致CSV文件中出现【''】这样的字符。通过上述方法，我们可以有效地去除CSV文件中的【''】字符，得到干净、整洁的数据，为后续的数据分析和可视化工作打下基础。在读取CSV文件时，可以使用。

如何通过Python中的pandas库清洗csv数据

weixin_35748962的博客

12-26

1061

首先，你需要使用pandas库中的read_csv()函数读取csv文件。这样你就可以得到一个pandas数据框，它是一种二维数据结构，类似于Excel中的工作表或SQL中的表格。然后，你可以使用数据框中的各种函数和方法来清洗数据。下面是一些常用的清洗数据的方法：使用head()函数查看数据的前几行，以确定数据的格式和内容。使用info()函数查看数据的概览，包括数据的类型、非空值数量等...

Jupyter：Python数据分析利器 - 网页版编程与Pycharm对比

Jupyter平台，特别是Ipython Notebook，是针对Python数据分析和科学计算的强大工具，它以网页形式呈现，使得开发者能够在浏览器中编写、运行和分享代码。以下是一些关键知识点： 1. **Jupyter的定义与功能**： - ...