python怎么处理数据_python中如何对csv文件中数据进行处理

1

首先,用pandas库读入csv文件为dataframe,将dataframe转化为python对象,写一个处理函数,如数据操作函数,如分词。

e40b3127e7ef2806056a266eb840b6f39087f2c2.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

2

然后,在此调用处理函数,得到新数据,将原csv数据和新数据写入新csv,

比如我要看第一行的所有列的数据,对每一行中的某列进行操作。

6a408cdd3340b6f3e3ecb7af12c0affce086eec2.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

3

然后,读入csv文件,首先要将csv文件查看下,整理成utf-8编码形式,然后使用pandas库的read_csv()方法,了解数据的概况,如count为记录数,即131行 data.describe()。

b7b28f87031c99c0da975535af2fa872951fedc2.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

4

然后,将dataframe转化为python对象我们看到 局座哭了.csv 有131行数据。能不能再对每行的每个元素进行抽取,比如抽取出每行中的comment。

9881b1fce186242fd01920ac35e434daf15ee8c2.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

5

然后,遍历dataframe中的每一行,首先我们要有知道行数,data.describe()告诉我们有131行,那任意的csv文件有多少行(record_num行数),我们必须自动化的知道。

256eb672941fbee44fb144edc1237971ff1de7c2.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

6

最后,比如提取出第1行中的comment,如数据操作函数,如只保留中文数据,我们检查下新的csv文件,是否如我们意,comment列是否已经清理,只保留中文。

bfa52adaf05e4a23071a4aae1dd818196020e2c2.jpg?x-bce-process=image%2Fresize%2Cm_lfit%2Cw_500%2Climit_1

END

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值