# 在对数据进行分析时,主要细分为明确目标、应用思维和如下8个具体步骤:
1、读取数据
2、清洗数据
3、操作数据
4、转换数据
5、整理数据
6、分析数据
7、展现数据
8、总结报告
接下来将介绍使用python来具体处理数据,包括上面几个步骤的实现,以及给出具体的操作例子。
需要记住的是使用python处理数据所用到的 具体函数、方法。
# 一、python读取数据
''''''
1、简要
2、如何从Excel文件中读取数据
3、如何从MySQL数据库中读取数据
4、如何从网页中读取数据
''''''
1、简要
读取数据时数据分析的第一步,相对来说比较简单,读取数据类型可以大致分为几类,一般用到的都是从 excel表、数据库、网页中进行读取。
我们使用python中的pandas库来实现读取操作。
2、如何从Excel文件中读取数据
Python代码如下:
读取数据之前需要导入pandas库
#导入pandas库
import pandas as pd
#导入Excel文件
df = pd.read_excel('文件名.xlsx')
3、如何从MySQL数据库中读取数据
读取数据之前需要安装pymysql模块
# 安装pymysql模块(在终端操作)
pip install pymysql
#安装后,读取操作代码如下:
import pandas as pd
import pymysql
# 创建数据库连接
conn = pymysql.connect(host='', user='', passwd='', database='')
# 创建游标
cursor = conn.cursor()
# 写SQL语句
sql = "select * from 表名"
#读取数据
df = pd.read_sql(sql,conn)