用python进行数据分析(一:数据理解)

本文介绍了如何使用Python进行数据分析,涵盖了数据导入(如CSV、TXT、数据库和Excel)以及数据理解的初步步骤,包括数据分布、特征分析和可视化方法(直方图、密度图、箱线图)。旨在帮助初学者掌握Python在数据分析中的基本应用。
摘要由CSDN通过智能技术生成

python作为当前主流的语言之一,他的功能是非常强大的。不论是在游戏行业还是数据分析行业还是软件开发啥的好像都可以用python,但作为一个数据分析师,并不需要用到他的全部功能。

只是想要达到“能够用python完成数据分析工作”的效果来帮助公司的实习生,所以整理了这个随笔。


一、数据导入

数据的导入是进行数据分析的第一步骤,一般提取的数据由文本格式(txt)、表格格式(csv/excel)及数据库文件(dmp/直连)。

  (1)导入csv

因为我个人习惯了r的相关数据结构和操作,所以我用pandas导入csv数据,可以直接导入DataFrame类型的数据。这种方法更接近R的操作方法,导入的数据类型也更便于操作。

 # -*- coding: utf-8 -*-
import pandas as pd data=pd.read_csv(open('d:/data/datafile.csv')) print(data.head(10))

很简单,第一行读库,第二行导入,第三行查看样例数据。

  (2)导入txt

这个我不常用。在网上找了一下:

1 data2 = open('E:\data\datafile.txt')
2 s=data2.read()

(3)连接数据库

大数据嘛,当然是连接数据库咯

#-*- coding:utf-8 -*-

import numpy as np
import pandas as pd
import matplotlib.pylab as plt
import mysql.connector
conn = mysql.connector.connect(host='localhost
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值