avatar
文章
9
标签
6
分类
3
首页
归档
分类
标签
关于
友鏈
留言板
LogoRainlin
首页
归档
分类
标签
关于
友鏈
留言板

模型架构

分类 - 模型架构
2026
2026-06-15
Qwen3.5 架构解析:Gated DeltaNet + Full Attention 混合架构
avatar
Rainlin
专注于大模型系统、推理优化与高性能计算。
文章
9
标签
6
分类
3
最新文章
Qwen3.5 架构解析:Gated DeltaNet + Full Attention 混合架构2026-06-15
大模型投机解码(三):Multi-token Prediction — 让模型自己当 Draft2026-06-15
NanoSpec:用上下文最小词表给投机解码再提速2026-06-11
大模型投机解码(二):EAGLE 系列 — 从特征外推到动态草稿树2026-06-08
大模型投机解码(一):Speculative Decoding — 奠基之作2026-06-05
分类
  • 投机解码4
  • 模型架构1
  • 量化4
标签
大模型推理 大模型量化 投机解码 模型架构 论文解读 LLM
归档
  • 六月 2026 9
网站信息
文章数目 :
9
本站访客数 :
本站总浏览量 :
最后更新时间 :
© 2025 - 2026 By Rainlin