关键缩写和包导入
在这个速查手册中,我们使用如下缩写:
1
2
df:任意的Pandas DataFrame对象
s:任意的Pandas Series对象
1
2
raw:行标签
col:列标签
引入响应模块:
1
2
import pandasas pd
import numpyas np
导入数据
pd.read_csv(filename_path):从CSV文件导入数据
pd.read_table(filename_path):从限定分隔符的文本文件导入数据
pd.read_excel(filename_path):从Excel文件导入数据
pd.read_sql(query, connection_object):从SQL表/库导入数据
pd.read_json(json_string):从JSON格式的字符串导入数据
pd.read_html(url):解析URL、字符串或者HTML文件,抽取其中的tables表格
pd.read_clipboard():从你的粘贴板获取内容,并传给read_table()
pd.DataFrame(dict):从字典对象导入数据,Key是列名,Value是数据
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
pd.read_excel(io, sheetname=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, parse_cols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, has_index_names=None, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False,**kwds)
'''该函数主要的参数为:io、sheetname、header、names、encoding。
io:excel文件,可以是文件路径、文件网址、file-like对象、xlrd workbook;
sheetname:返回指定的sheet,参数可以是字符串(sheet名)、整型(sheet索引)、list(元素为字符串和整型,返回字典{'key':'sheet'})、none(返回字典,全部sheet);(如果一个excel含有多个表,如果你只想读入其中一个可以:df = pd.read_excel('log.xls', sheetname=1))