科学计算库Numpy
创建数组:
- numpy.array()
- numpy.arange()
查看数组:
- dtype
- ndim 维度
- shape 形状
- size 元素个数
数组操作:
- tolist 转换列表
- reshape 修改形状
- array[start:stop:step] 切片(含左不含右)
- numpy.append 添加元素
- numpy.insert 插入元素
- numpy.delete 删除元素
- numpy.unique 数组去重
- numpy.concatenate() 数组连接
- numpy.stack() 数组堆叠
- numpy.split() 数组分割
- numpy.transpose() 数组转置
相关函数:
- 字符串函数
- 数学函数
- 统计函数
科学计算库Pandas
读取数据:
- pandas.read_csv()
- pandas.read_excel()
- df = pandas.DataFrame()
查看数据:
- dtypes 通过列的类型选取列
- shape 形状
- df.info() 信息
- df.describe() 描述
- df.count() 非nan数量
- df.isnull() 是否为空
- df.unique() 唯一值
- head() 头部数据
- tail() 尾部数据
数据提取:
- loc() 按字段提取
- iloc() 按位置提取
- usecols 读取数据时,使用此函数选择列
数据预处理:
- merge() 多表合并
- append() 表追加
- join() 表连接
- set_index() 设置索引
- index_col 行索引
- sort_index() 按照索引排序
- sort_values() 按值排序
- value_counts() 计算某一列或行中有哪些不同值,并排序
数据清洗:
- drop_duplicates() 删除重复行
- fillna() 填充
- map() 映射
- df[‘字段’].str.replace() 字符串替换
数据分析:
- groupby() 分组聚合
- pivot_table() 透视