使用Python进行数据分析时——numpy、pandas的常用函数

科学计算库Numpy

创建数组:

  • numpy.array()
  • numpy.arange()

查看数组:

  • dtype
  • ndim 维度
  • shape 形状
  • size 元素个数

数组操作:

  • tolist 转换列表
  • reshape 修改形状
  • array[start:stop:step] 切片(含左不含右)
  • numpy.append 添加元素
  • numpy.insert 插入元素
  • numpy.delete 删除元素
  • numpy.unique 数组去重
  • numpy.concatenate() 数组连接
  • numpy.stack() 数组堆叠
  • numpy.split() 数组分割
  • numpy.transpose() 数组转置

相关函数:

  • 字符串函数
  • 数学函数
  • 统计函数

科学计算库Pandas

读取数据:

  • pandas.read_csv()
  • pandas.read_excel()
  • df = pandas.DataFrame()

查看数据:

  • dtypes 通过列的类型选取列
  • shape 形状
  • df.info() 信息
  • df.describe() 描述
  • df.count() 非nan数量
  • df.isnull() 是否为空
  • df.unique() 唯一值
  • head() 头部数据
  • tail() 尾部数据

数据提取:

  • loc() 按字段提取
  • iloc() 按位置提取
  • usecols 读取数据时,使用此函数选择列

数据预处理:

  • merge() 多表合并
  • append() 表追加
  • join() 表连接
  • set_index() 设置索引
  • index_col 行索引
  • sort_index() 按照索引排序
  • sort_values() 按值排序
  • value_counts() 计算某一列或行中有哪些不同值,并排序

数据清洗:

  • drop_duplicates() 删除重复行
  • fillna() 填充
  • map() 映射
  • df[‘字段’].str.replace() 字符串替换

数据分析:

  • groupby() 分组聚合
  • pivot_table() 透视
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值