Donut:文档了解厘革的官方完成
各位好,又晤面了,我是 GitHub 精选君!
在处理文档时,我们常常面临诸多挑唆,比如光学字符识别(OCR)的限定、多样化文档典范和言语的繁复性。但是,这些成绩正是 Donut 项目所努力处理的。
今天要给各位保举一个 GitHub 开源项目 clovaai/donut,该项目在 GitHub 有凌驾 3.0k Star,用一句话先容该项目就是:“Official Implementation of OCR-free Document Understanding Transformer (Donut) and Synthetic Document Generator (SynthDoG), ECCV 2022”。
项目先容
Donut(文档了解厘革)是一种使用端到端 Transformer 模子的无 OCR 文档了解办法,并提供了 OCR-free Document Understanding Transformer(Donut)和 Synthetic Document Generator(SynthDoG)的官方完成。Donut 不必要事后练习的 OCR 引擎/API,却在种种视觉文档了解职责(如视觉文档分类和信息提取)中展现出最优秀的功能。
主要功效先容:
- ? OCR-free 文档了解:使用 Transformer 模子完成无 OCR 的文档了解,处理了传统 OCR 办法的限定。
- ? 多范畴、多言语支持:经过 SynthDoG(Synthetic Document Generator),Donut 在模子预练习阶段具有对多种言语和范畴的机动性。
别的,项目提供了具体的计划要点和完成细节,确保了项目标高功能和可扩展性。
项目推介
Donut是一个活泼的开源项目,是文档了解范畴的紧张奉献。该项目在 ECCV 2022 中被先容,并由一批具有丰厚履历的研讨职员协同开发。其出色的功能和机动性使其遭到广泛眷注和使用。
我们保举该项目给其他人,无论是对文档了解范畴感兴致的研讨者,照旧必要处理文档的开发职员。经过 Donut,您可以轻松处理文档了解中的挑唆,提升事情听从和准确性。
以下是该项目 Star 趋向图(代表项目标活泼水平):
更多项目具体请查察如下链接。
开源项目地点:https://github.com/clovaai/donut
开源项目作者:clovaai
以下是到场项目建立的一切成员:
眷注我们,一同探究故意思的开源项目。