构建生物医学知识图谱from zero to hero （2）：文献抽取

ASKCOS

于 2024-02-23 14:22:03 发布

阅读量54

点赞数

分类专栏： AIDD | CADD | 化学 | 生物文章标签：知识图谱人工智能

本文链接：https://blog.csdn.net/weixin_43236007/article/details/136253589

版权

AIDD | CADD | 化学 | 生物专栏收录该内容

75 篇文章 139 订阅 ¥299.90 ¥399.90

订阅专栏

超级会员免费看

本文介绍了如何从零开始构建生物医学知识图谱，特别是通过将文献转换为图片并利用pytesseract进行文字识别。文章以皮肤疾病治疗和再生医学的应用为例，探讨了皮肤重建和再生的需求，以及干细胞在该领域的应用。

摘要由CSDN通过智能技术生成

我们选取一篇文献，将文献PDF转换成图片，然后采用pytesseract 实现图片文字识别。

import requests
import pdf2image
import pytesseract

pdf = requests.get('https://arxiv.org/pdf/2110.03526.pdf')
doc = pdf2image.convert_from_bytes(pdf.content)

# Get the article text
article = [

了解本专栏

超级会员免费看

ASKCOS

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录