数据分析——数据评估

本文介绍了Python中的wptools库,用于访问MediaWiki API并处理脏数据和杂乱数据。通过wptools,可以方便地获取维基百科页面的详细信息,并进行数据清理工作。
摘要由CSDN通过智能技术生成

wptools 库

MediaWiki 有一堆不同的访问库,可以满足当前的各种编程语言。这是 Python 的 列表。这对于大多数 API 都比较标准。一些库比其他库更好一点,但也是标准的。对于 MediaWiki,Python 中最新和可读的库是 wptools。Twitter 的类似关系是:

  • MediaWiki API → wptools
  • Twitter API → tweepy

wptools 使用 Mahatma Gandhi 维基百科页面 的 GitHub 页面上有一个更简单的教程,可作为示例使用。

如果要获取一个 page 对象,使用 如下:

page = wptools.page('Mahatma_Gandhi')

其中 'Mahatma_Gandhi' 是这个页面 上维基百科 URL 的最后一位。这个 page 对象的一些方法可以让我们获得有关维基百科页面的各种数据,包括页面上的所有图像。要获取所有数

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值