开云体育官方网站 - KAIYUN

kaiyun sports 竣事文档通晓,云知声推出工业级文档智能基础大模子

发布日期:2026-04-04 02:24 点击次数:56 你的位置:开云体育官方网站 - KAIYUN > 开云盘口 >

kaiyun sports 竣事文档通晓,云知声推出工业级文档智能基础大模子

26日,云知声隆重推出 Unisound U1-OCR 文档智能基础大模子。算作首个工业级文档智能基座,该模子凭借 “性能 SOTA、信得过可验、开箱即用、高效部署、强适配” 五大上风,冲破传统文档处理领域。

传统视觉决议(OCR 1.0,以CRNN 为代表)仅能识别翰墨,新一代多模态决议(OCR 2.0,以VLM为代表 )具备端到端版面意会智力和翰墨识别智力。而 Unisound U1-OCR 开启 OCR 3.0 期间——严防会版面的基础上,进一步瞻念察文档深层语义,竣事自动分类与业务级信息抽取,完成了从“字符感知”到“文档通晓”的质的飞跃。

当先,它领有“先懂结构,再读内容”的灵敏。传统模子频频按公法幽静阅读,而Unisound U1-OCR创举了“语义初始+动态聚焦”政策。如同东说念主类阅读习气,先梳理文档目次、标题的层级关系,再按需索要内容。模子能自动构建文档的“语义舆图”,精确识别标题、图表与正文的隶属关系,即使靠近排版宽广的顶点场景,也能层次明晰地索要信息。

其次,开云体育它具备尖锐的“空间感知力”。通过强化空间对王人模块,模子能充分诓骗翰墨在页面上的位置信息,主动意会元素间的空间布局。麇集动态分歧率本事,无论是密集表格还是图文混排,它都能精确回话文档结构,透彻科罚了以往模子“张冠李戴”的空间盲区。

在骨子应用场景中,通用OCR器具在专科鸿沟存在局限——举例医保结算单中“自付一”“自付二”与“个东说念主私费”的逻辑关系,或公约中金额大小写的校验规矩,都需要领域学问援助。

Unisound U1-OCR在基础模子之上,融入了云知声在医疗、金融等鸿沟的行业学问蕴蓄,模子可基于业务逻辑进行多字段相干校验。在里面业务测试中,面向50余种常见业务告示的分类准确率超过99%。

再比如,传统决议在明白报纸、期刊等多栏穿插、图文交汇的复杂版面时,易堕入“下一段该读那里”的阅读迷航。而Unisound U1-OCR模子的突破在于,它不再机械地按固定公法扫描页面,而是像东说念主不异,麇集陡立文语义与版面逻辑,自动判断段落的说合关系,精确梳理出稳妥东说念主类阅读习气的内容流。

南边+记者 郜小平kaiyun sports

天博体育(TianboSports)官网

热点资讯

推荐资讯