LogicAI @_LogicAI, Twitter Profile

LogicAI @_LogicAI

6 months ago

译： RAG的"死亡论"自大上下文窗口LLM诞生起就从未停歇：几个标志性的"死亡节点"： • 2023年5月 Anthropic发布10万token上下文窗口的Claude • 2024年2月谷歌推出支持100万token的Gemini 1.5 • 2025年3月（预测）模型上下文协议实现数据直连但现实是：即使扩展到200万token的超级上下文窗口，现有长文本LLM仍只能处理"玩具级"数据集。比如100万token大约对应1500页文档，看似惊艳的演示效果，却远达不到生产级应用需求。即便我们假设存在无限token的上下文窗口： • 扩展性与成本：处理百万级token速度缓慢，算力与资金成本双高。即便算力成本下降，响应延迟仍是应用瓶颈 • 性能衰减：LLM仍受困"中间信息丢失"现象，无法有效处理长文本中部信息。精准筛选相关文档、避免"大海捞针"反而能提升效果 • 数据安全：向基础模型全量开放数据存在严重隐私风险。在医疗金融等强监管领域，必须实施基于角色的数据访问权限管控归根结底：长文本LLM与RAG必须双轨并行。既然"RAG"这个词充满争议，我们不妨换个说法：可以称作"智能检索" 或者"上下文筛选" 亦或"知识精馏" 无论命名如何，对注入上下文窗口的数据质量把控，将直接决定生成内容的质量水平。毕竟在AI领域，"输入垃圾，输出也只能是垃圾"才是永恒真理。

Leonie @helloiamleonie

6 months ago

50 101 638 60K 388

Download Image

0 0 0 112 0