当前位置: 首页 > news >正文

ftp制作网站现在做网站用的软件

ftp制作网站,现在做网站用的软件,连云港企业网站建设,wordpress首页等待画面LazyLLM旨在优化大型语言模型#xff08;LLM#xff09;在处理长文本语境下的推理效率。传统上#xff0c;LLM的推理过程分为预填充和解码两个阶段#xff0c;其中预填充阶段负责计算并存储输入提示的所有token的键值#xff08;KV#xff09;缓存#xff0c;这一步骤在…LazyLLM旨在优化大型语言模型LLM在处理长文本语境下的推理效率。传统上LLM的推理过程分为预填充和解码两个阶段其中预填充阶段负责计算并存储输入提示的所有token的键值KV缓存这一步骤在面对长提示时会显著增加首次生成token的时间消耗成为效率瓶颈。LazyLLM通过动态剪枝策略解决了这一问题它仅计算对下一个token预测至关重要的KV并将剩余token的计算推迟到它们变得相关时。不同于一次性剪枝整个提示的静态方法LazyLLM允许模型在不同生成步骤中灵活选取不同的上下文子集即使这些子集在先前步骤中已被剪枝。LazyLLM能够大幅减少首次生成token的时间同时几乎不牺牲性能。此外该方法可以无缝集成到现有的基于Transformer的LLM中无需任何微调即可提升推理速度。 1 动态Token剪枝 推理过程分为两个阶段预填充Prefilling和解码Decoding。预填充阶段需要计算所有提示Prompttoken的键值KV缓存这在长提示的情况下会显著增加“首次生成token时间”Time-To-First-Token, TTFT而成为性能瓶颈。动态token剪枝旨在选择性地计算那些对下一个token预测至关重要token的KV缓存。 方法: 采用渐进式token剪枝Progressive Token Pruning在预填充阶段而且在解码阶段动态选择重要token进行计算允许模型在不同生成步骤中动态选择上下文的不同子集战略性地在后期层中剪枝更多token而在早期层中保留更多token以平衡效率和性能。 实现: 在每个生成步骤中使用注意力图确定token的重要性。具体来说使用注意力概率来决定输入token相对于要预测的下一个token的重要性。与静态剪枝不同动态剪枝在每个步骤优化下一个token的预测即使某些token在先前的步骤中被剪枝过也可能再次被选中。 2 渐进式KV增长 传统的LLM推理过程中预填充阶段需要计算所有输入token的KV缓存这一步骤会显著增加生成第一个token所需的时间成为生成过程中的瓶颈。通过分析发现并非所有的输入token对于预测下一个token都是必要的许多token可以被剪枝而不影响输出质量。LazyLLM采用动态token剪枝策略只计算那些对下一个token预测重要的KV值而“懒惰地”将剩余令牌的计算推迟到它们变得相关时。该方法允许模型在不同的生成步骤中动态地从上下文中选择不同的token子集即使这些token在之前的步骤中被剪枝。 累积token使用率累积token使用率定义为每个给定步骤的KV缓存大小展示了在不同生成步骤中使用的token比例及其反向未使用的token比例。 层级敏感性后期Transformer层相对于前期层对token剪枝更为不敏感这意味着后期层保持更少的token也能有较好的性能。为了平衡速度和准确性采用渐进式剪枝早期层保留更多的token而在后期层逐渐减少。 辅助缓存Aux Cache由于每个解码步骤依赖于预填充阶段计算的KV缓存来计算注意力当token在后续层的KV缓存中缺失时模型无法检索其KV值。引入辅助缓存以存储被剪枝token的隐藏状态以便在后续迭代中潜在地检索避免了重复计算同一token确保每个token在每个Transformer层最多计算一次并保证LazyLLM的最坏运行时间不会慢于基线。 3 结语 文章提出了LazyLLM技术这是一种针对长上下文场景下提高大型语言模型(LLM)推理效率的方法它通过动态选择性计算关键token来加速预填充阶段同时保持推理性能无需额外的模型微调。并且LazyLLM可以无缝集成到现有的基于Transformer的LLM中提高推理速度。 论文题目LazyLLM: Dynamic Token Pruning for Efficient Long Context LLM Inference 论文链接https://arxiv.org/abs/2407.14057 PS: 欢迎大家扫码关注公众号_我们一起在AI的世界中探索前行期待共同进步
http://www.yingshimen.cn/news/11859/

相关文章:

  • 织梦做的网站怎么会被黑深圳高端电商网站建设者
  • 广州网站开发方案网站公司怎么做运营商
  • 网站吸引客户北京网站设计技术乐云seo
  • 建设营销网站多少钱同源大厦 网站建设
  • 介绍家乡的网站怎么做设计制作生态瓶教案
  • 智慧旅游网站开发与设计与实现网络企业
  • asp手机网站统计代码市场监督管理局查询系统
  • 网站开发脚本解析器四川省和城乡建设厅网站
  • 给网站做rss个人网站怎么盈利
  • 厦门做企业网站的公司奉化seo页面优化外包
  • 公司建设网站属于什么费用做地方门户网站怎样
  • 做app的网站注册一个互联网公司需要多少钱
  • 网站建设与制作工程造价信息网站
  • 网站让图片充满屏幕怎么做外贸建站深圳
  • 素材下载网站源码连云港今天的新消息
  • 老河口网站设计装饰网站案例
  • 怎么查网站接入商做网站的软件叫code
  • 惠州网站制作维护百度搜索大数据查询
  • 张家港网站建设培训河北招标网
  • 商务网站教程新乡小程序开发公司
  • wordpress不适合大型网站Wordpress怎么连接百度网盘
  • 东莞市建设局网站6企业网站开发期末报告
  • 网站开发是干什么的申请完域名如何建网站
  • 新网站制作公司松滋做网站
  • 哪些网站可以找兼职做室内设计wordpress博客实现ajax
  • 电脑版商城网站建设惠州手工外发加工网
  • 新开网站为什么做网站网站
  • 网站建设需要步骤网络营销托管服务商指的是
  • 卡片式设计 网站邯郸seo优化
  • 网站建设文字内容怎样优化网站