Featured image of post 使用 Docker 来执行 MinerU

使用 Docker 来执行 MinerU

一个用于执行 MinerU 的 Docker Image

MinerU 是一个 PDF 处理工具。

MinerU 安装实际上已经很简单了,但是为了让这个过程更加简单,我创建了一个 docker image。

镜像的名称是: svtter/mineru;是基于另外镜像构建的。

部署文件是:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
services:
  mineru:
    image: svtter/mineru
    volumes:
      - ./data:/opt/data
    deploy:
      resources:
        reservations:
          devices:
            - driver: nvidia
              count: all
              capabilities: [gpu]

使用方法

创建一个 minuer 目录,下文以~/mineru为例。

进入~/mineru 目录,执行docker compose run mineru bash

例如:

1
svtter@ubuntu:~/mineru$ docker compose run mineru bash

(这是加载 mineru 环境)

如果直接启动报错,一般是没有 gpu 的问题。

可以这样来使用:

1
2
3
docker run -it --rm  \
    -v $(pwd)/pdfs:/opt/data \
    svtter/mineru:latest bash

在容器环境中,执行mineru -p example.pdf -o output

即可在 output 文件夹中获得解析后的 pdf 文件

默认数据目录在 ~/mineru/data,你可以自己修改

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计