遏制AI幻觉:苹果DeepMMSearch-R1论文揭秘“图像裁剪”搜索术

网站小编 2
《遏制AI幻觉:苹果DeepMMSearch-R1论文揭秘“图像裁剪”搜索术》是一篇关于人工智能(AI)领域的论文,该论文探讨了苹果公司的DeepMMSearch-R1项目中使用的一种技术——图像裁剪搜索术。,在当前的人工智能领域,人们常常面临着AI幻觉的问题,即机器学习模型由于缺乏足够的数据而导致错误预测的情况,在这篇论文中,研究者发现了一种创新的技术,它能够有效地解决这一问题。,通过深入分析和应用这种方法,研究人员揭示了一个令人惊讶的事实:利用图像裁剪搜索术,他们不仅能够提高模型的准确率,还能够在一定程度上克服AI幻觉的影响,这表明,即使在面对大量数据不足的情况下,也可以通过合理的算法和技术来优化AI系统的性能。,这篇文章展示了如何运用新技术来提升人工智能系统的表现,并且提供了实际可行的方法来应对AI幻觉的问题,这不仅为未来的研究和发展提供了新的方向,也为实际应用中的AI系统提出了更高的要求。

IT之家 1 月 15 日消息,科技媒体 Appleinsider 今天(1 月 15 日)发布博文,报道称苹果发表重磅研究论文,详细介绍名为 DeepMMSearch-R1 的 AI 模型,重点优化 AI 在复杂视觉场景下的搜索逻辑,用“裁剪”治愈 AI 幻觉。

遏制AI幻觉:苹果DeepMMSearch-R1论文揭秘“图像裁剪”搜索术

针对现有 AI 模型在处理复杂视觉信息时常出现的“答非所问”或“漏看”问题,苹果推出了 DeepMMSearch-R1 模型。传统模型在面对“图中左上角那只鸟的最高时速是多少”这类复合问题时,往往因无法聚焦局部细节而给出错误的平均数据。

遏制AI幻觉:苹果DeepMMSearch-R1论文揭秘“图像裁剪”搜索术

DeepMMSearch-R1 引入了独特的“视觉定位工具(Grounding Tool)”,能够主动裁剪图片以剔除干扰信息,先精准识别微小目标,再进行针对性的网络搜索验证,从而确保答案的事实准确性。

为确保模型仅在必要时才启用裁剪功能以节省算力,研究人员采用了“监督微调(SFT)+ 在线强化学习(RL)”的组合训练法。SFT 负责教会模型“不乱剪”,而 RL 则提升了工具调用的效率。

遏制AI幻觉:苹果DeepMMSearch-R1论文揭秘“图像裁剪”搜索术

测试数据显示,该模型在处理需精准图文对应的问题上,表现显著优于目前的 RAG(检索增强生成)工作流及基于提示词的搜索智能体,成功解决了 AI 在常识性事实检索中的“偷懒”现象。

遏制AI幻觉:苹果DeepMMSearch-R1论文揭秘“图像裁剪”搜索术

IT之家附上参考地址

标签: 幻觉 图像 苹果

抱歉,评论功能暂时关闭!