阿里开源了一个全新的Agent:WebWatcher,这是一个Deep Research形态的Agent,最大的特点是利用了多模态大模型,可以提取图片数据来增强分析能力。32B的多模态模型配合RAG Flow的效果在几个评测中好于单纯使用文本的GPT-4o、Gemin等模型。只是不知道速度方面怎么样,图像识别可能影响速度。
阿里开源了一个全新的Agent:WebWatcher,这是一个Deep Research形态的Agent,最大的特点是利用了多模态大模型,可以提取图片数据来增强分析能力。32B的多模态模型配合RAG Flow的效果在几个评测中好于单纯使用文本的GPT-4o、Gemin等模型。只是不知道速度方面怎么样,图像识别可能影响速度。
41
93
829
1.1M
298
Download Image