NVIDIA剪枝蒸馏出Llama-3.1-Minitron 4B AI模型！

关注我们的 WhatsApp 频道, TikTok 与 Instagram 以观看最新的短视频 - 开箱，测评与第一手新闻资讯。

NVIDIA公司联合Meta公司发布了最新的Llama-3.1-Minitron 4B AI模型，主要通过结构化权重剪枝、知识提炼等尖端技术，成功蒸馏（Distill）出 40 亿参数的“小而强”模型。

小而强，英伟达剪枝、蒸馏出 Llama-3.1-Minitron 4B AI 模型

Llama-3.1-Minitron 4B模型在Llama-3.1-Minitron 8B基础上蒸馏而来，NVIDIA在深度和宽度方向上使用了结构化剪枝技术。剪枝是一种删除网络中不那么重要的层或神经元的技术，保留其性能的情况下，目的是减小模型的大小和复杂度。

NVIDIA通过从模型中删除16层来进行深度剪枝，并将其从8B模型缩减为4B模型，此外还部署另一种技术，通过修剪嵌入维度和MLP中间层来进行宽度剪枝。除了剪枝，Nvidia 还采用了经典蒸馏技术来提高Llama-3.1-Minitron 4B的效率。

Using structured weight pruning and knowledge distillation, the @NVIDIAAI research team refined Llama 3.1 8B into a new Llama-3.1-Minitron 4B.

They're releasing the new models on @huggingface and shared a deep dive on how they did it ➡️ https://t.co/fJTrcfzx9m pic.twitter.com/hTNVFwGjjh
— AI at Meta (@AIatMeta) August 15, 2024

知识蒸馏是一个过程，在这个过程中，一个较小的模型（即学生）会被训练成模仿一个更大、更复杂的模型（即教师）的行为。通过这种方式，较小模型中保留了原始模型的大部分预测能力，但速度更快，资源更节省。

NVIDIA将此与蒸馏技术和剪枝技术相结合，确保重新训练的4B模型性能优异，并在更大的模型中得到很好的应用。

【资料来源】

大家来评论

CY Hor | 新闻/资讯 | 8月 17, 2024 7:36 上午

1	Infinix Hot 70 Pro	N/A
2	Huawei Pura 90s Pro Max	RM4899
3	HONOR 400 Pro	RM2699
4	Apple iPhone 17 Pro Max	RM5999
5	Oppo Reno 12 Pro	RM2459
6	Redmi Note 15 5G	RM849
7	vivo V70	RM1999
8	Honor 600 Lite	RM1399
9	Honor 200 Pro	RM1990
10	Samsung Galaxy A55	RM1200

NVIDIA剪枝蒸馏出Llama-3.1-Minitron 4B AI模型！

NVIDIA剪枝蒸馏出Llama-3.1-Minitron 4B AI模型！

OnePlus 13正面渲染图出炉，淘汰双曲面屏！

Epic Games Store登陆iOS/Android平台：iPhone只有欧盟用户玩得到！

每日十大点击