1.Introduction to Python:
这里首先讲了一下python的基础语法,基本数据类型,然后了解了list类型,引用与新建list对象的区别。
之后讲了function和method的区别,因为python万物皆对象,实质上可以认为function为全局函数对象,method为类成员对象函数,即method需要'.'来调用,function不需要。最后讲了一下numpy库,讲了numpy不同于list的一些特性,如numpy对象内部元素类型相同,对其进行计算实质上是对其进行矢量计算,即对应元素的计算。最后讲了几个统计学的函数,平均值np.mean(),中位数median(格式同上),标准差std,关联度corrcoef
2.Intermediate Python for Data Science
首先讲了一下matplotlib库的三中图,折线图plot,散点图scatter,直方图hist,以及一些常见的属性定制。
然后讲了一下字典类型以及一些操作,之后是pandas库,利用字典或者从csv文件中生出一个dataframe对象,用loc,iloc或者直接[]选取特定的值,[]可以直接访问列,行访问需要用切片,而loc,iloc可以直接访问行,列访问需要第一维指定确定的行,即方框方便简单访问列,而loc对综合性的访问更好用。
之后讲了一下布尔类型,布尔操作符(and or not)利用布尔来筛选numpy以及条件控制结构。再见了一下循环的使用,enumerate给列表返回index,np.nditer()返回多维数组的单个元素,items访问字典索引+value,iterrows按行访问dataframe,
apply函数添加一列。
最后讲了下random,随机漫步以及可视化图形的选择transpose对矩阵转置。