1. Python 导入数据
使用Pandas库中的DataFrame类型存放导入的数据
2. 导入文本文件
使用pandas.read_csv()方法
import pandas as pd
data = pd.read_csv()
"""
常用参数解读:
filepath_or_buffer: str, 文件路径
sep: str, 分隔符, 默认","
header: int, 行索引, 默认从0开始, 自增
index_col: int, 设置某一列为行索引, 默认None,不设置
dtype: dict, 列数据类型
skiprows: list or int 要从头跳过的行(列表存放)或要跳过多少行(整数表示)
skipfooter: int 跳过尾部多少行
na_value: scalar, str, list-like, dict 识别空值
skip_blank_lines: bool, 跳过空白行, 相当于直接按行删除空值, 默认为False
"""
3. 导入Excel文件
pandas.read_excel()方法
import pandas as pd
data = pd.read_excel()
'''
常用参数:
io: 文件路径, 可以是URL地址(http, ftp, s3和file)
sheet_name: int, str, list, 工作表名, 默认为0
int类型, 表示索引, 默认第0张表
str类型, 表名, 例如: 'sheet1'表示表名为sheet1的表
list类型, 一次导入多个表, [0 ,1 ,'sheet4'] 导入索引为0和1以及表名为sheet4的三张表
header: int, 行索引, 默认为0,自增
names: list, 设置列名列表
index_col: int, 设置某一列作为行索引, 默认为0, 不设置
dtype: 设置列数据类型
'''
4. 导入Mysql数据
pandas读取数据库数据, 需要借助第三方数据库连接模块
4.1. 使用pymysql读取数据
使用pymysql查询数据
使用pd.DataFrame()转换
import pandas as pd
pd.DataFrame()
'''
参数:
data=None, ndarray、Interable、dict、DataFrame 数据
index=None: Index or array-like 行索引, 默认从0开始自增长
columns=None: Index or array-like 列索引, 默认从0开始自增长
dtype=None:数据类型
copy=False: 是否拷贝
'''
使用pymysql库连接数据库, 使用pandas.read_sql()获取数据
import pandas as pd
pd.read_sql()
'''
参数:
sql: str, sql语句
con: 数据库连接对象
index_col: 设置为行索引的列
'''