文章目录
最终效果展示
MinerU安装成功
上回说道,MinerU可以将pdf转化为Markdown,这对于大语言模型的知识库构建来说,十分重要。
由于我是windows电脑,使用的安装步骤是,直接从github下载MinerU的项目文件夹,在该文件夹启动终端。
并使用:
docker build -t mineru:latest .
构建镜像。
这个过程,在我这儿竟花费了足足一个半小时。害我几部短剧都看完了,也没等到最终的结果。
下一步:
docker run --rm -it --gpus=all mineru:latest /bin/bash
按照官方的教程,到这里就已经是成功了。
我们要上传个pdf到这个container里。
在docker desktop的界面上,找到这个container,可以拷贝它的ID。
使用docker cp命令向其中添加pdf。(注意docker cp命令是在container之外打的。)
先测试一下是否有什么异常(又回到了docker里面):
magic-pdf --help
执行转换命令:
magic-pdf -p test.pdf -o testdir -m auto
开始干活儿了。
6G现存也可以支持,开心啊!
最终结果在这儿可以看。
效果还可以啊!