爬虫

BeautifulSoup解析网页 用于解析HTML或XML 步骤: 创建BeautifulSoup对象 查询节点 find,找到第一个满足条件的节点 find all 找到所有满足条件的节点 创建对象 创建BeautifulSoup对象 查找节点 可按节点类型、属性或内容访问

Pandas 一个强大的分析结构化数据的工具集 基础是Numpy,提供了高性能矩阵的运算 应用,数据挖掘,数据分析 如:学生成绩分析、股票数据分析等 提供数据清洗功能 Series 类似一维数组的对象 通过list构建Series ser_obj = pd.Series(range(10)) 由数据和索引组成 索引在左,数据在右 索引是自动创建的 获取数据和索引 ser_obj.index,ser_obj.values 预览数据 ser_obj.head(n)

DataFrame 类似多维数组/表格数据(如:excel,R中的data.frame) 每列数据可以是不同的类型 索引包括行索引和列索引 通过ndarray创建DataFrame 通过dic创建DataFrame 通过列索引获取列数据(Series类型) df_obj[col_idx]或df_obj.col_idx 增加列数据,类似dict添加key_value df_obj[new_col_idx] = data 删除列 del df_obj[col_idx]

索引操作 连续索引 不连续索引

pandas统计计算和描述

转载于:https://my.oschina.net/u/4094847/blog/3034758

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值