USPTO PatentPublicData 开源项目教程
项目地址:https://gitcode.com/gh_mirrors/pa/PatentPublicData
1. 项目介绍
USPTO/PatentPublicData
是一个由美国专利商标局(USPTO)开发的开源工具包,旨在帮助用户下载和解析公开的专利数据。该项目的主要模块包括 Bulk Downloader
和 Patent Document
,分别用于自动化下载公开的专利数据和直接从大型批量文件中读取专利文档。
主要功能
- 批量下载专利数据:自动下载公开的专利授权和申请数据,以及其他资源。
- 直接查看专利文档:从大型批量文件中直接查看单个专利文档。
- 读取专利文档:支持从1976年至今的专利文档格式(包括Greenbook、SGML、PAP和Redbook XML),并将其转换为标准化的专利对象模型。
- 提取和转换专利数据:从批量文件中提取专利文档,并进行数据标准化和转换。
2. 项目快速启动
环境准备
- Java 8 或更高版本
- Maven
下载项目
git clone https://github.com/USPTO/PatentPublicData.git
cd PatentPublicData
构建项目
mvn clean install
运行示例
java -cp target/PatentPublicData-1.0-SNAPSHOT.jar com.uspto.BulkDownloader
3. 应用案例和最佳实践
案例1:专利数据分析
使用 PatentPublicData
下载并解析专利数据,构建专利数据库,用于后续的专利分析和研究。
案例2:自动化专利监控
通过定期运行 Bulk Downloader
模块,自动下载最新的专利数据,并将其导入到现有的专利管理系统中,实现自动化专利监控。
最佳实践
- 数据备份:定期备份下载的专利数据,以防数据丢失。
- 性能优化:根据实际需求调整下载和解析的并发数,以提高处理效率。
4. 典型生态项目
1. PatentView
PatentView
是一个开源的专利数据可视化工具,可以与 PatentPublicData
结合使用,将解析后的专利数据导入 PatentView
进行可视化分析。
2. Google Patents Public Datasets
Google Patents Public Datasets 提供了大规模的专利数据集,可以与 PatentPublicData
结合使用,进行更深入的专利数据分析。
3. Open Patent Services (OPS)
OPS 是欧洲专利局提供的专利数据服务,可以与 PatentPublicData
结合使用,获取全球范围内的专利数据。
通过这些生态项目的结合,可以构建一个全面的专利数据分析平台,满足不同用户的需求。