马文/meɪvən/ – a trusted expert who seeks to pass timely and relevant knowledge on to others.
maven的目标是通过提供对原始和处理格式的开放数据集的简单访问,减少数据科学家在数据清理和准备上花费的时间。
maven的构建目的是:通过消除数据问题、添加公共标识符和重塑数据以使其适合模型,提高开放数据的可用性和完整性。
最原始形式的源数据来自最权威的数据提供程序,所有转换都可用作开放源代码,以增强完整性和信任。
尽可能遵守数据许可证,同时通过在设备上执行所有数据检索和处理,避免与重新分发数据有关的潜在问题(特别是未提供明确许可证的开放数据集)。
安装pip install maven
用法importmavenmaven.get('general-election/UK/2015/results',data_directory='./data/')
数据集
通过单击数据集的名称,可以使用所有数据集的数据字典。DatasetDescriptionDateSourceLicenceModel-ready datasets for forecasting the 2015 and 2017 UK General Elections2010, 2015 & 2017 dataMixed
UK General Election opinion pollingMay 2005 - June 2017Unknown
运行测试
对已安装的版本运行测试(可以是pip install .或pip install maven):$ cd /path/to/repo
$ pytest
在开发过程中运行测试:$ cd /path/to/repo
$ python -m pytest
许可证NameDescriptionAttribution StatementFree to copy, publish, distribute, transmit, adapt and exploit commercially or non-commercially. See URL for full details.Contains Parliamentary information licensed under the Open Parliament Licence v3.0.
Free to copy, publish, distribute, transmit, adapt and exploit commercially and non-commercially. See URL for full details.Contains public sector information licensed under the Open Government Licence v2.0.
贡献
马文是为你的贡献而设计的!检查是否有未解决的问题或新问题,以围绕您的想法或错误展开讨论。
从github上的forkthe repository开始对主分支(或其分支)进行更改。
对于新的数据集,确保已处理的数据集完全用数据字典记录。对于新的特性和bug,请编写一个测试,显示bug已被修复或该特性按预期工作。
发送一个pull request并对维护程序设置bug,直到它被合并并发布。
欢迎加入QQ群-->: 979659372
推荐PyPI第三方库