pandas处理csv

 

 

import pandas as pd
from pandas import Series,DataFrame

 

打开csv文件

deli = pd.read_csv('../得力.csv')

转换为DataFrame数据类型

df = DataFrame(data=deli)

更改列名

df.rename(columns={"title":"商品名称","price":"价格","prodCode":"型号","brand":"品牌","cskucode":"商品id","detailDesc":"商品简介","First_class":"一级分类","Second_class":"二级分类"},inplace=True)
df.drop(["_id"],axis=1,inplace=True)
df

根据列名重新排列

df = df.loc[:,["商品名称","价格","型号","品牌","商品id","商品简介","一级分类","二级分类"]]

处理列中字符串

df["商品名称"] = df["商品名称"].str.strip("\n")
df

保存DataFrame数据为csv文件

df.to_csv("test得力.csv",encoding="utf_8_sig")

 

关于utf-8与utf_8_sig的区别:

UTF-8以字节为编码单元,它的字节顺序在所有系统中都是一様的,没有字节序的问题,也因此它实际上并不需要BOM(“ByteOrder Mark”)。但是UTF-8 with BOM即utf-8-sig需要提供BOM。

1)程序输出中出现乱码的原因是因为python2中中文编码的问题,需要注意的是要将处理的中文文件的编码和python源文件的编码保持一致,这样不会出现中文乱码。

2)在程序中能够正常输出中文,但是导出到文件后使用excel打开是出现中文乱码是因为excel能够正确识别用gb2312、gbk、gb18030或utf_8 with BOM 编码的中文,如果是utf_8 no BOM编码的中文文件,excel打开会乱码。

其他:

判断列中是否有空值

df.isnull().any(axis=0)

DataFrame文档链接 http://pandas.pydata.org/pandas-docs/stable/reference/frame.html

转载于:https://www.cnblogs.com/JinMuBaoBao/p/10885533.html

Pandas是一个强大的Python库,用于数据分析和处理。它提供了灵活且高效的数据结构,如DataFrame,用于处理和操作构化数据,比如CSV文件。引用中给出了使用Pandas处理CSV文件的示例代码。 首先,需要导入os、pandas和numpy库。然后,可以使用`read_csv`函数来读取CSV文件。在这个函数中,可以指定需要读取的行数、列数以及跳过的行数。例如,可以使用`skiprows`参数跳过第一行表名行,使用`usecols`参数选择指定的列。这样,我们就可以从CSV文件中筛选出我们需要的行和列。通过遍历不同的CSV文件,我们可以提取出每个文件中的特定数据,比如时间和rss列的数据。最后,可以将提取的数据整合到一个新的CSV文件中。 使用Pandas处理CSV文件可以大大提高工作效率,特别是当需要处理大量的CSV文件时。引用中的博客分享了作者处理2410个CSV文件的经验,通过使用Pandas库,作者成功地提取了所需的数据并整合到一个新的CSV文件中。 如果你对Pandas库的更多细节感兴趣,可以查阅Pandas官方文档。引用中提供了Pandas库官方文档的链接,你可以通过Chrome浏览器翻译并浏览官方文档,了解更多有关Pandas库的用法和功能。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [使用Python(pandas库)处理csv数据](https://blog.csdn.net/singghet/article/details/104935345)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值