python目前生信的流行语言,其优点不仅在于面向对象编程,适合作为入门语言,还在于学好python可以转行!!!跳出生物坑!!!偶然机会接触七月在线的python数据分析课程,作为入门课程性价比也是极高的,第一节课便对数据分析所必备各种库做了简介
常见库的安装和学习
1.Numpy简介
NumPy是Python语言的一个扩充程序库。支持高级大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。
核心数据结构:ndarray
例子:矩阵计算优化
import numpy as np
# 使用普通一维数组生成NumPy一维数组
data = [6, 7.5, 8, 0, 1]
arr = np.array(data)
print(arr)
print(arr.dtype) # 类型
print('')
# 使用普通二维数组生成NumPy二维数组
data = [[1, 2, 3, 4], [5, 6, 7, 8]]
arr = np.array(data)
print(arr)
print(arr.shape) # 维度
print('')
# 使用zeros/empty
print(np.zeros(10)) # 生成包含10个0的一维数组
print(np.zeros((3, 6))) # 生成3*6的二维数组
print(np.empty((2, 3, 2))) # 生成2*3*2的三维数组,所有元素未初始化。
print('')
# 使用arrange生成连续元素
print(np.arange(15)) # [0, 1, 2, ..., 14]
numpy同样支持索引和切片,但与python的list不同,numpy为引用优先
# 使用切片访问和操作数组
arr = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
print(arr[1:6]) # 打印元素arr[1]到arr[5],和list切片不同,这里是引用。
arr = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
print(arr[:2]) # 打印第1、2行
print(arr[:2, 1:]) # 打印第1、2行,第2、3列
print(arr[:, :1]) # 打印第一列的所有元素
arr[:2, 1:] = 0 # 第1、2行,第2、3列的元素设置为0
print(arr)
2.pandas简介
Pandas