chapter.外部数据读取和存储1.1

对于数据分析而言,数据大多数还是来源于外部,比如常用的CSV文件,Excel文件和数据库文件等。

文本数据的读取和存储

1.CSV文件的读取
pandas库提供了将表格型数据读取为DataFrame数据结构的函数,常用的有read_csv和read_table函数
read_csv从文件中加载带分隔符的数据,默认分隔符为逗号 read_table从文件中加载带分隔符的数据,默认分隔符为制表符
先通过python自带的csv库创建CSV文件。

import csv
s=open('F:/python文件/oo.csv','w',newline='')
writer=csv.writer(s)
writer.writerow(('学号','姓名','成绩'))
writer.writerow(('1001','李华','90'))
writer.writerow(('1002','晓明','98'))
writer.writerow(('1003','小红','99'))
s.close()

运行之后
找到文件位置,新生成一个oo.csv文件
在这里插入图片描述
这样就新建完成了,使用read_csv读取

import pandas as pd
from IPython.display import display
data=pd.read_csv(open('F:/python文件/oo.csv'))
display(data)

在这里插入图片描述
在读取CSV文件时,如果文件路径中有中文时,需要加open函数,否则会报错。
read_table读取

import pandas as pd
from IPython.display import display
data=pd.read_table(open('F:/python文件/oo.csv'),sep=',')
display(data)

在这里插入图片描述
2.TXT文件的读取
TXT文件使用的分隔符可能并不是逗号,这里创建一个分隔符为?的TXT文件

import csv
s=open('F:/python文件/oo.txt','a+')
s.writelines('学号?姓名?成绩'+'\n')
s.writelines('1001?李华?90'+'\n')
s.writelines('1002?晓明?98'+'\n')
s.writelines('1003?小红?99'+'\n')
s.close()

在这里插入图片描述
读取

import pandas as pd
from IPython.display import display
data=pd.read_table(open('F:/python文件/oo.txt'),sep='?')
display(data)

在这里插入图片描述
3.文本数据的存储
在对数据进行处理和分析之后,通常会把数据存储起来。

import pandas as pd
from IPython.display import display
data=pd.read_table(open('F:/python文件/oo.csv'),sep=',')
display(data)

在这里插入图片描述
利用DataFrame的to_csv方法,可以将数据存储到以逗号分隔符的csv文件中。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值