
上一篇专利数据统计中需要搞清楚的首要问题(1)介绍了通过合并申请号避免重复统计,理清了专利篇数和专利件数的问题,那么还有一类统计就是对发明项数的统计,这里就涉及到对同一项发明的重复统计问题。上一篇介绍的相同申请号但不同公开号的专利是“同一项发明”,而同一项发明在不同国家申请,也会产生不同的版本,例如阿里巴巴在中国申请某项专利后,为了在欧洲获得保护,又在欧洲申请了相同的专利,由于发明内容相同,也属于同一项发明创造,但公开号和申请号都不相同,这就是我们常说的专利族(同族),在统计阿里巴巴有多少项专利技术时, 就需要去除这些在不通专利局的重复公开版本(也就是同族合并处理),将在不同专利局申请的同一项发明创造合并为一条记录,这样也可以避免重复浏览。
我们再回顾一下专利族的定义,专利族常用的有简单同族和扩展同族。简单同族信息根据DocDB给出的简单同族ID加工,根据定义,简单专利族成员优先权完全一致,等同于“also published as”,是定义较为严格范围较窄的专利家族。扩展同族信息根据优先权信息加工,根据定义,扩展专利族的文献之间至少能通过一个优先权发生关联,是范围更广的专利家族。
WIPO对简单专利族和扩展专利族的定义如图所示。