Pandas 导入CSV文件 (8)Python 数据分析从零开始

写任何有关pandas的代码前,我们应该先导入pandas

    import pandas as pd

我们下面出现全部的pd都代表对pandas的引用

 

关于CSV文件格式

        CSV即Comma Separate Values(逗号分隔值),默认使用逗号来进行分隔列的一类文本文件。此分隔符可以改变,因为逗号在很多地方都会出现,所以做分隔符有时不是太合理。

        比如:2019,03,21,Hello,Qianyue,good day.,from fox

        这样一使用逗号分隔难免出现歧义,以为句子里边包含了逗号,其实可以用""括起来,但是在生产环境中,还是会遇到各种问题。因此一般对于CSV文件,我们经常选用一些特殊的符号来标识分隔符。比如 0x01这个分隔符,因其无法使用键盘输入,所以经常在大数据hadoop中使用,也是hive的默认分隔符。逗号分隔符比较简单我们不做实验了,我们直接使用0x01来做实验。

        生成新测试对象

import pandas as pd
data ="""电影名\x01票房\x01评分
        流浪地球\x0146\x019.0
        上海堡垒\x011\x013.5"""
with open("c:/CSDN/pandas/a.csv",'a') as tmp_file:
tmp_file.write(data)

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值