如今数据分析越来越重要,比起使用excel等工具,使用编程语言更加高效。这篇文章主要介绍一些简单的数据分析入门知识,使用的语言是python。
读取csv文件
数据分析的第一步是要利用程序读取csv文件:
例子1:
import csv
with open('a.csv') as csvfile:
mpg = list(csv.DictReader(csvfile))
mpg[:3]
例子2:
ds_file = "/home"
with open(ds_file, 'w') as csvfile:
fout = csv.writer(csvfile, delimiter='|')
for airport in airports:
fout.writerow(airport)
Pandas
Panda库是处理dataframe的强有力工具, 我们可以处理两种类型的数据:
Series: one-dimensional, 一维数据
values = pd.Series(data, index=idx)
series = pd.Series(range(5), index=['a','b','c','d','e'])
DataFrame: two-dimensional,二维数据
dt = {
'A': [0,2,3,45],
&#