NVIDIA剪枝蒸馏出Llama-3.1-Minitron 4B AI模型!

关注我们的 WhatsApp 频道, TikTokInstagram 以观看最新的短视频 - 开箱,测评与第一手新闻资讯。

NVIDIA公司联合Meta公司发布了最新的Llama-3.1-Minitron 4B AI模型,主要通过结构化权重剪枝、知识提炼等尖端技术,成功蒸馏(Distill)出 40 亿参数的“小而强”模型。

Llama-3.1-Minitron 4B模型在Llama-3.1-Minitron 8B基础上蒸馏而来,NVIDIA在深度和宽度方向上使用了结构化剪枝技术。剪枝是一种删除网络中不那么重要的层或神经元的技术,保留其性能的情况下,目的是减小模型的大小和复杂度。

NVIDIA通过从模型中删除16层来进行深度剪枝,并将其从8B模型缩减为4B模型,此外还部署另一种技术,通过修剪嵌入维度和MLP中间层来进行宽度剪枝。除了剪枝,Nvidia 还采用了经典蒸馏技术来提高Llama-3.1-Minitron 4B的效率。

知识蒸馏是一个过程,在这个过程中,一个较小的模型(即学生)会被训练成模仿一个更大、更复杂的模型(即教师)的行为。通过这种方式,较小模型中保留了原始模型的大部分预测能力,但速度更快,资源更节省。

NVIDIA将此与蒸馏技术和剪枝技术相结合,确保重新训练的4B模型性能优异,并在更大的模型中得到很好的应用。

资料来源

大家来评论

NVIDIA剪枝蒸馏出Llama-3.1-Minitron 4B AI模型!

| 新闻/资讯 |