MinerU 是一个 PDF 处理工具。
MinerU 安装实际上已经很简单了,但是为了让这个过程更加简单,我创建了一个 docker image。
镜像的名称是: svtter/mineru;是基于另外镜像构建的。
部署文件是:
| |
使用方法
创建一个 minuer 目录,下文以~/mineru为例。
进入~/mineru 目录,执行docker compose run mineru bash
例如:
| |
(这是加载 mineru 环境)
如果直接启动报错,一般是没有 gpu 的问题。
可以这样来使用:
| |
在容器环境中,执行mineru -p example.pdf -o output
即可在 output 文件夹中获得解析后的 pdf 文件
默认数据目录在 ~/mineru/data,你可以自己修改
