python数据分析第一步:读取以及查看数据

 

用python做数据分析第一步,通常会遇到需要将现成文件(数据库里导出来,或者其他情况下获得的各种文件)拿来处理分析的情况,下面来说下利用python的标准库pandas来读取以及查看数据的方法

1、文件读取

首先将用到的pandas和numpy加载进来

import pandas as pd

import numpy as np

读取数据:

#csv和xlsx分别用read_csv和read_xlsx,下面以xlsx

 

为例

df=pd.read_csv('f:\1024.csv') 

有时产生报错是因为斜杠的问题:改成双斜杠就可以

df=pd.read_csv('D:\\py\\python\\data\\xx1106.csv')


2、查看数据

df.head()  

#默认出5行,括号里可以填其他数据

标题栏如果是中文产生了乱码,如何解决?

3、查看数据类型

df.dtypes

4、利用现有数据生成一列新数据

比如:max_time和min_time是现有的两列,现在业务需要生成一列gs,gs=max_time-min_time

df.['gs']=df.['max_time']-['min_time']

#查看是否成功

df.head()

5、查看基本统计量

df.describe(include='all')  # all代表需要将所有列都列出

 

好了,今天就这么多了,以上代码都运行检验过

---------------以上于16年11月

------------以下于19年7月1日--

用read_table读文件,无论txt还是csv都可以读,指定encoding='gb2312'可以中文乱码的问题

import pandas as pd
data = pd.read_table('D:\\py\\python\\data\\theme_revenue1106.csv',encoding='gb2312', sep=',')

读CSV文件

 

读txt文件

  • 5
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值