python笔记6:数据处理之导入数据

# -*- coding: utf-8 -*-
#数据一般存储在文件(csv、txt、excel)和数据库中

#1. 导入csv文件(第一行是列名)

from pandas import read_csv

#文件的编码格式也应该是 utf-8 才行,否则报错
df = read_csv(
              'D:/python/workspace/pythonStudy/jysj.csv',
              encoding = 'utf-8'
              )

#2. 导入文本文件(比csv文件自由,没有规定第一行必须是列名)

from pandas import read_table

#没导入有列名的txt文件(默认会把第一行数据当作列名,为了避免,我们应该指定列名):
df = read_table(
                'D:/python/workspace/pythonStudy/jysjWithoutColumnName.txt',
                names=['交易类型','出卖人名称','出卖人证件类型','出卖人证件号码','买受人名称','买受人证件类型','买受人证件号码','房屋坐落','层次','房屋用途','房屋结构','建筑面积',"建筑年代","交易额","交易时间"],
                sep=',' #表示txt中的数据是以逗号隔开的(不加这一句会造成把所有的数据当成一列导入进来)
                )

#导入有列名的txt文件
df = read_table(
                'D:/python/workspace/pythonStudy/jysjWithColumnName.txt',
                names=['交易类型','出卖人名称','出卖人证件类型','出卖人证件号码','买受人名称','买受人证件类型','买受人证件号码','房屋坐落','层次','房屋用途','房屋结构','建筑面积',"建筑年代","交易额","交易时间"],
                sep=','
                )


#3. 导入excel文件
#语法:read_excel(fileName,sheetName,names)

from pandas import read_excel
df = read_excel(
                'D:/python/workspace/pythonStudy/jysj.xls',
                sheetname='吉木萨尔县近三年房屋交易信息'
                )

#4. 解决文件名包含中文的问题:
#加上engine参数即可:
df = read_excel(
                'D:/python/workspace/pythonStudy/中文文件名.xls',
                sheetname='吉木萨尔县近三年房屋交易信息',
                #engine='python'
                )


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值