百度最新开源模型PaddleOCR-VL登顶HuggingFace Trending全球第一-名品导购网

百度开源模型PaddleOCR-VL登顶HuggingFace Trending全球

编辑:民品导购网发布于2025-11-01 03:46

导读： 10月17日消息 HuggingFace官网显示百度昨晚发布的自研多模态文� 解析模型PaddleOCR VL 发布20小时内即登� HuggingFaceTrending全球据了解该模型核心参...

10月17日消息，HuggingFace官网显示，百度昨晚发布的自研多模态文档解析模型PaddleOCR-VL，发布20小时内即登顶HuggingFace Trending全球。

据了解，该模型核心参数仅0.9B，轻量高效，能以极低计算开销精准识别文本、手写汉字、表格、公式、图表等复杂元素，支持109种语言。在权威榜单OmniBenchDoc V1.5中，它以92.6分获综合性能全球，四大核心能力全线SOTA，超越GPT-4o等模型，刷新OCR VL模型性能纪录。

作为文心4.5衍生模型，PaddleOCR-VL融合了NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型，实现精度与效率双突破。

10月17日消息，HuggingFace官网显示，百度昨晚发布的自研多模态文档解析模型PaddleOCR-VL，发布20小时内即登顶HuggingFace Trending全球。

作为文心4.5衍生模型，PaddleOCR-VL融合了NaViT动态分辨率视觉编码器与ERNIE-4.5-0.3B语言模型，实现精度与效率双突破。

加载全文

百度开源模型PaddleOCR-VL登顶HuggingFace Trending全球