微博

电脑版
提示:原网页已由神马搜索转码, 内容由weibo.com提供.
24-04-26 14:16发布于 北京 来自 微博网页版
Meta 推出了LayerSkip,一种全新的端到端解决方案,专门用于提高大语言模型(LLM)的推理速度。#ai#

在不同规模的Llama模型上进行的多种训练实验中,LayerSkip推理解决方案均展现出显著的性能提升。

例如在CNN/DM文档摘要任务上速度提升至2.16倍,在编程任务上提升至1.82倍,在TOPv2语义解析任务上提升至2.0倍。

论文地址:O网页链接
欢迎新用户

正在加载,请稍候...