中图分类法的正则表达式参考


1. 中图分类法

中图分类法,全称为《中国图书馆图书分类法》,简称《中图法》,是中国国内普遍采用的一种图书分类体系,用于组织和管理图书馆藏书,方便读者查找和借阅图书资料。它是一种按照学科性质和内容,结合图书资料本身的特点,将图书划分为多个类别,并使用汉语拼音字母与阿拉伯数字相结合的混合制号码进行标识的方法。

《中图法》最初起源于20世纪50年代,历经多次修订和完善,形成了较为成熟的分类体系。其基本结构包括五大部类:马列主义、毛泽东思想,哲学,社会科学,自然科学,综合性图书,并在此基础上进一步细分为22个基本大类。每个大类下面还有更加详细的二级、三级甚至更多级别的子类目。

分类法的目的是使同类图书集中在一起,便于图书管理和读者查找,同时也能体现学科之间的逻辑关系和知识体系的构建。随着图书情报学的发展和信息技术的应用,《中图法》也在不断修订更新以适应新的学术研究和信息服务需求。

一级类列表:

  1. A: 马克思主义、列宁主义、毛泽东思想、邓小平理论
  2. B: 哲学、宗教
  3. C: 社会科学总论
  4. D: 政治、法律
  5. E: 军事
  6. F: 经济
  7. G: 文化、科学、教育、体育
  8. H: 语言、文字
  9. I: 文学
  10. J: 艺术
  11. K: 历史、地理
  12. N: 自然科学总论
  13. O: 数理科学和化学
  14. P: 天文学、地球科学
  15. Q: 生物科学
  16. R: 医药、卫生
  17. S: 农业科学
  18. T: 工业技术
  19. U: 交通运输
  20. V: 航空、航天
  21. X: 环境科学、安全科学
  22. Z: 综合性图书

中图分类法作为一种图书分类法,旨在将图书馆藏书和其他资料按照主题或内容分类,以便更好地组织和检索图书馆的馆藏。更详细的中图分类号查询参考这里

2. 正则表达式

目前对于中图分类号的正则表达式网上并没有找到可用的版本,我结合了中图分类号的一些通用规则写了一版正则表达式:

patten = "((?:[A-KN-SU-VXZ][-/]?[0-9]{2,3}(?:.[0-9]{1,3})?)|(?:(?:T-0[19])|(?:T-1[89])|(?:T-29)|(?:T-6[235])|(?:T-9)|(?:T[B-V][-/]?[0-9]{1,3})))"

说明:这个表达式可以找出大部分的中图分类号,但是有误匹配的概率,对于大部分场景应该足够使用了!

3. 使用方法

以 Python 为例:

text = "CAEBN:1-001-00-905700-0分类号: I247.5 A849.13"
patten = "((?:[A-KN-SU-VXZ][-/]?[0-9]{2,3}(?:.[0-9]{1,3})?)|(?:(?:T-0[19])|(?:T-1[89])|(?:T-29)|(?:T-6[235])|(?:T-9)|(?:T[B-V][-/]?[0-9]{1,3})))"
code_list = re.findall(patten, text)
print(code_list)

输出:

['I247.5', 'A849.13']

4. 参考

http://www.ztflh.com/

  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SmallerFL

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值