Featured image of post 开源标注平台的选择

开源标注平台的选择

label studio 标注,cvat 的线上服务问题

我们在选择开源数据标注平台上遇到了一些问题,这里做一个记录。

开源标注平台的普遍问题,就是线上服务贵。label studio 需要 149 美元/月/人,cvat 需要 33 美元/月/人。

实际上这种平台如果有一定的编程能力,可以很快的在内网搭建并且部署。我之前开发的一个简单的平台,大概也就花费了3天。不需要设置标注员之类的工作,只需要写一个简单的 web 页面即可。

label studio 的问题

我们首先部署了开源版本的 label studio。

label studio 有很强大的标注能力,这毋庸置疑。但是,开源版本无法大规模应用,因此不建议大家选用。

label studio 的开源版本没有权限限制。也就是说,标注人员可以任意操作数据集。如果数量大,那么可能会出现这样的场景:

  1. 4个人努力标注
  2. 1个人不小心删除了数据

5个人工作白费。

但是,如果你团队中的成员素质较高,这个问题可以很大程度的缓解。

通过 url 等屏蔽方式修改 label studio 终究不是正道。$149 美元/月 的定价也高的离谱。

我们的任务是计算机视觉任务,因此我们后续会采用 cvat 这条路线看看。

cvat 的问题

我们尝试使用了云端版本的 cvat,体验不错(距离上次我使用实际上也才 100 天而已,提升很大)。

但是,经过调研,我们发现线上版本不适合直接标注,费用也比较高。

标注成本

因此,我们最终决定尝试一下 cvat 私有化部署版本。如果还是不行,我认为可以直接自己写一个工具来标注。

成本计算器

此外,开发了一个简单的标注成本计算器,可以供大家使用:

https://svtter.cn/cost_computing/

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计