您正在访问的位置:首页>资讯 > 黄金行情

智象未来发布全新自回归图像编辑框架 VAREdit ,0.7 秒完成高保真图像编辑

编辑:民品导购网 发布于2025-10-14 12:46
导读: 近日 智象未来团队正式推出全新自回归图像编辑框架VAREdit 作为全球纯自回归的图像编辑模型 这也是该领域的又一重大突破 该框架不仅能够精准执行用户指令 避免过度修改 还将编辑速度提升至0 7秒级 ...

近日,智象未来团队正式推出全新自回归图像编辑框架 VAREdit,作为全球纯自回归的图像编辑模型,这也是该领域的又一重大突破。该框架不仅能够精准执行用户指令,避免过度修改,还将编辑速度提升至0.7秒级,为实时交互与高效创作开辟新路径。

  

长期以来,扩散模型在图像编辑中虽能生成高质量画面,但存在局部修改牵动整体结构、编辑不够精准,以及多步迭代效率低等瓶颈。针对这一问题,VAREdit首次将视觉自回归(VAR)架构引入图像编辑任务。它将编辑定义为"下一尺度预测",逐层生成多尺度残差特征,实现局部精准修改与整体结构保持的统一。同时,团队创新设计了尺度对齐参考(SAR)模块,有效解决尺度匹配难题,进一步提升编辑质量与效率。

  

在权威基准 EMU-Edit 与 PIE-Bench 测试中,VAREdit在CLIP与GPT等指标全面领先。其中,VAREdit-8.4B在GPT-Balance指标上较ICEdit和UltraEdit分别提升41.5%和30.8%;轻量版VAREdit-2.2B可在0.7秒内完成512×512图像高保真编辑,实现数倍提速。

  

目前,VAREdit已在 GitHub 和 Hugging Face 平台全面开源。智象未来团队表示,未来将持续探索视频编辑、多模态生成等应用场景,推动AI图像编辑迈入高效、可控、实时的新纪元。

  

  【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com   

  

近日,智象未来团队正式推出全新自回归图像编辑框架 VAREdit,作为全球纯自回归的图像编辑模型,这也是该领域的又一重大突破。该框架不仅能够精准执行用户指令,避免过度修改,还将编辑速度提升至0.7秒级,为实时交互与高效创作开辟新路径。

  

长期以来,扩散模型在图像编辑中虽能生成高质量画面,但存在局部修改牵动整体结构、编辑不够精准,以及多步迭代效率低等瓶颈。针对这一问题,VAREdit首次将视觉自回归(VAR)架构引入图像编辑任务。它将编辑定义为"下一尺度预测",逐层生成多尺度残差特征,实现局部精准修改与整体结构保持的统一。同时,团队创新设计了尺度对齐参考(SAR)模块,有效解决尺度匹配难题,进一步提升编辑质量与效率。

  

在权威基准 EMU-Edit 与 PIE-Bench 测试中,VAREdit在CLIP与GPT等指标全面领先。其中,VAREdit-8.4B在GPT-Balance指标上较ICEdit和UltraEdit分别提升41.5%和30.8%;轻量版VAREdit-2.2B可在0.7秒内完成512×512图像高保真编辑,实现数倍提速。

  

目前,VAREdit已在 GitHub 和 Hugging Face 平台全面开源。智象未来团队表示,未来将持续探索视频编辑、多模态生成等应用场景,推动AI图像编辑迈入高效、可控、实时的新纪元。

  

  【免责声明】本文仅代表作者本人观点,与和讯网无关。和讯网站对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。邮箱:news_center@staff.hexun.com   

加载全文

名品导购网(www.mpdaogou.com)陕ICP备2026003937号-1

CopyRight 2005-2026 版权所有,未经授权,禁止复制转载。邮箱:mpdaogou@163.com