USPTO PatentPublicData 开源项目教程

USPTO PatentPublicData 开源项目教程

项目地址:https://gitcode.com/gh_mirrors/pa/PatentPublicData

1. 项目介绍

USPTO/PatentPublicData 是一个由美国专利商标局(USPTO)开发的开源工具包,旨在帮助用户下载和解析公开的专利数据。该项目的主要模块包括 Bulk DownloaderPatent Document,分别用于自动化下载公开的专利数据和直接从大型批量文件中读取专利文档。

主要功能

  • 批量下载专利数据:自动下载公开的专利授权和申请数据,以及其他资源。
  • 直接查看专利文档:从大型批量文件中直接查看单个专利文档。
  • 读取专利文档:支持从1976年至今的专利文档格式(包括Greenbook、SGML、PAP和Redbook XML),并将其转换为标准化的专利对象模型。
  • 提取和转换专利数据:从批量文件中提取专利文档,并进行数据标准化和转换。

2. 项目快速启动

环境准备

  • Java 8 或更高版本
  • Maven

下载项目

git clone https://github.com/USPTO/PatentPublicData.git
cd PatentPublicData

构建项目

mvn clean install

运行示例

java -cp target/PatentPublicData-1.0-SNAPSHOT.jar com.uspto.BulkDownloader

3. 应用案例和最佳实践

案例1:专利数据分析

使用 PatentPublicData 下载并解析专利数据,构建专利数据库,用于后续的专利分析和研究。

案例2:自动化专利监控

通过定期运行 Bulk Downloader 模块,自动下载最新的专利数据,并将其导入到现有的专利管理系统中,实现自动化专利监控。

最佳实践

  • 数据备份:定期备份下载的专利数据,以防数据丢失。
  • 性能优化:根据实际需求调整下载和解析的并发数,以提高处理效率。

4. 典型生态项目

1. PatentView

PatentView 是一个开源的专利数据可视化工具,可以与 PatentPublicData 结合使用,将解析后的专利数据导入 PatentView 进行可视化分析。

2. Google Patents Public Datasets

Google Patents Public Datasets 提供了大规模的专利数据集,可以与 PatentPublicData 结合使用,进行更深入的专利数据分析。

3. Open Patent Services (OPS)

OPS 是欧洲专利局提供的专利数据服务,可以与 PatentPublicData 结合使用,获取全球范围内的专利数据。

通过这些生态项目的结合,可以构建一个全面的专利数据分析平台,满足不同用户的需求。

PatentPublicData Utility tools to help download and parse patent data made available to the public PatentPublicData 项目地址: https://gitcode.com/gh_mirrors/pa/PatentPublicData

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

薄垚宝

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值