【RKI-084】ザーメンベストの金字塔ザーメン大好き2000発 24時間赶超 GPT-4o，最高大模子 Llama 3.1 405B 通宵封神，扎克伯格：开源引颈新时期

就在刚刚【RKI-084】ザーメンベストの金字塔ザーメン大好き2000発 24時間，Meta 依期发布了 Llama 3.1 模子。

简单来说，最新发布的 Llama 3.1 405B 是 Meta 迄今为止最高大的模子，亦然全球咫尺最高大的开源大模子，更是全球最强的大模子。

从今天起，不需要再争论开源大模子与闭源大模子的孰优孰劣，因为 Llama 3.1 405B 用无可辩驳的实力阐发阶梯之争并不影响最终的手艺实力。

先给全球追想一下 Llama 3.1 模子的特质：

包含 8B、70B 和 405B 三个尺寸，最大高下文普及到了 128K，因循多谈话，代码生成性能优秀，具有复杂的推理技艺和器用使用技巧从基准测试收尾来看，Llama 3.1 越过了 GPT-4 0125，与 GPT-4o、Claude 3.5 互有输赢提供怒放/免费的模子权重和代码，许可证允许用户进行微调，将模子蒸馏到其他模式，并因循在职何处所部署提供 Llama Stack API，便于集成使用，因循调和多个组件，包括调用外部器用

附上模子下载地址：

https://huggingface.co/meta-llamahttps://llama.meta.com/

超大杯登顶全球最高大模子，中杯大杯藏惊喜

本次发布的 Llama 3.1 共有 8B、70B 和 405B 三个尺寸版块。

从基准测试收尾来看，超大杯 Llama 3.1 405B 全标的耐压了 GPT-3.5 Turbo、大部分基准测试得分越过了 GPT-4 0125。

而靠近 OpenAI 此前发布的最强闭源大模子 GPT-4o 和第一梯队的 Claude 3.5 Sonnet，超大杯依然有着一战之力，致使不错仅从纸面参数上说，Llama 3.1 405B 绚烂着开源大模子初度追上了闭源大模子。

具体细分到基准测试收尾，Llama 3.1 405B 在 NIH/Multi-needle 基准测试的得分为 98.1，天然比不上 GPT-4o，但也标明其在处理复杂信息的技艺上号称完好。

况兼 Llama 3.1 405B 在 ZeroSCROLLS/QUALITY 基准测试的得分为 95.2，也意味着其具有高大整合多半文本信息的技艺，这些收尾标明，LLaMA3.1 405B 模子在处理长文本方面出色，关于情态 LLM 在 RAG 方面性能的 AI 应用确立者来说，可谓是相配友好。

尤为情态的是，Human-Eval 主若是安稳测试模子在交融和生成代码、不休玄虚逻辑技艺的基准测试，而 Llama 3.1 405B 在与其他大模子的比拼中亦然稍占优势。

除了主菜 Llama 3.1 405B，虽为配菜的 Llama 3.1 8B 和 Llama 3.1 70B 也献技了一出「以小胜大」的好戏。

就基准测试收尾来看，Llama 3.1 8B 险些碾压了 Gemma 2 9B 1T，以及 Mistral 7B Instruct，举座性能致使比 Llama 3 8B 都有显贵普及。Llama 3.1 70B 更是能越级校服 GPT-3.5 Turbo 以及性能通晓优异的 Mixtral 8×7B 模子。

据官方先容，在此次发布的版块中，Llama 商讨团队在 150 多个涵盖多种谈话的基准数据集上对模子性能进行了评估，以及团队还进行了多半的东说念主工评估。

最终得出的论断是：

咱们的旗舰模子在多种任务上与顶尖的基础模子，如 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 等，具有竞争力。同期，咱们的袖珍模子在与参数数目周边的紧闭和怒放模子比拟时，也展现出了竞争力。

Llama 3.1 405B 是怎样真金不怕火成的

那 Llama 3.1 405B 是怎样磨练的呢？

据官方博客先容，看成 Meta 迄今为止最大的模子，Llama 3.1 405B 使用了越过 15 万亿个 token 进行磨练。

为了收场这种规模的磨练并在短期间内达到预期的效力，商讨团队也优化了悉数这个词磨练堆栈，在越过 16000 个 H100 GPU 上进行磨练，这亦然第一个在如斯大规模上磨练的 Llama 模子。

团队也在磨练过程中作念了一些优化，要点是保握模子确立过程的可膨大性和简单性：

遴荐了仅进行小数过错的范例解码器 Transformer 模子架构，而不是搀和内行模子，以最大限度地提高磨练清醒性。接受了一种迭代后磨练设施，每一轮都使用监督微融合平直偏好优化。这使得商讨团队能够为每轮创建最高质地的合成数据，并普及每项功能的性能。相较于旧版 Llama 模子，商讨团队改动了用于预磨练和后磨练的数据数目和质地，包括为预磨练数据确立更预处理和不休管说念，为后磨练数据确立更严格的质地保证与过滤步履。

Meta 官方示意，在 Scaling Law 的影响之下，新的旗舰模子在性能上越过了使用调换步履磨练的袖珍模子。

商讨团队还欺诈了 405B 参数模子来普及袖珍模子的磨练后质地。

为了因循 405B 规模模子的大规模分娩推理，国产港台商讨团队将模子从 16 位（BF16）精度量化到 8 位（FP8）精度，这么作念有用减少了所需的计较资源，并使得模子能够在单个劳动器节点内运行。

Llama 3.1 405B 还有一些值得发掘的细节，比如其在筹画上预防实用性和安全性，使其能够更好地交融和执行用户的领导。

通过监督微调、绝交采样和平直偏好优化等步履，在预磨练模子基础上进行多轮对皆，构建聊天模子，Llama 3.1 405B 也能够更精准地适合特定的使用场景和用户需求，提高骨子应用的通晓。

值得一提的是，Llama 商讨团队使用合成数据生成来产生绝大多数 SFT 示例，这意味着他们不是依赖简直全国的数据，而是通过算法生成的数据来磨练模子。

此外，商讨团队团队通过屡次迭代过程，连续改动合成数据的质地。为了确保合成数据的高质地，商讨团队接受了多种数据处理手艺进行数据过滤和优化。

通过这些手艺，团队能够膨大微调数据量，使其不仅适用于单一功能，而是不错跨多个功能使用，加多了模子的适用性和纯真性。

简单来说，这种合成数据的生成和处理手艺的应用，其作用在于创建多半高质地的磨练数据，从而有助于普及模子的泛化技艺和准确性。

看成开源模子阶梯的拥趸，Meta 也在 Llama 模子的「配套设施」上给足了诚意。

Llama 模子看成 AI 系统的一部分，因循调和多个组件，包括调用外部器用。发布参考系统和开源示例应用设施，荧惑社区参与和合营，界说组件接口。通过「Llama Stack」范例化接口，促进器用链组件和智能体应用设施的互操作性。模子发布后，悉数高档功能对确立者怒放，包括合成数据生成等高档职责流。Llama 3.1 405B 内置器用大礼包，包含关节技俩，简化从确立到部署的过程。

值得防卫的是，新开源公约里，Meta 不再谢却用 Llama 3 来改动其他模子了，这其中也包括最强的 Llama 3.1 405B，真·开源大善东说念主。

附上 92 页论文磨练阐发地址：

https://ai.meta.com/research/publications/the-llama-3-herd-of-models/

一个由开源引颈的新时期

网友 @ZHOZHO672070 也火速在 Hugging Chat 上测试了一下 Llama 3.1 405B Instruct FP8 对两个经典问题的回应情况。

缺憾的的是， Llama 3.1 405B 在不休「9.11 和 9.9 谁更大」的用功上碰到翻车，不外再次尝试之下，又给出了正确谜底。而在「我一把把把住了」的拼音标注上，其通晓也尚可。

网友更是只用了不到 10 分钟的期间，就使用 Llama 3.1 模子快速构建和部署了一个聊天机器东说念主。

另外，Llama 里面科学家 @astonzhangAZ 也在 X 上知道，其商讨团队咫尺正在酌量将图像、视频和语音功能集成到 Llama 3 之中。

开源和闭源之争，在大模子时期依然延续着，但今天 Meta Llama 3.1 新模子的发布为这场辩说画上了句号。

Meta 官方示意，「到咫尺为止，开源大型谈话模子在功能和性能方面大多落伍于紧闭式模子。咫尺，咱们正迎来一个由开源引颈的新时期。」

Meta Llama 3.1 405B 的出身阐发了一件事情，模子的技艺不在于开或闭，而是在于资源的参预、在于背后的东说念主和团队等等，Meta 遴荐开源大致出于好多要素，但总会有东说念主扛起这面大旗。

而看成第一个吃螃蟹的巨头，Meta 也因此收成了首个超过最强闭源大模子的 SOTA 名称。

Meta CEO 扎克伯格在今天发布的长文《Open Source AI Is the Path Forward》中写说念：

初中萝莉液液酱

「从来岁运行，咱们预测昔时的 Llama 将成为业内开端进的。但在此之前，Llama 依然在开源性、可修改性和资本效力方面起初。」

开源 AI 模子大致也志不在超过闭源，或出于手艺平权，不会让其成为少数东说念主谋利的妙技，或出于世东说念主拾柴火焰高，激动 AI 生态的繁茂发展。

正如扎克伯格在其长文末尾所描写的愿景那样：

我深信 Llama 3.1 版块将成为行业的一个搬动点，大多数确立东说念主员将运行转向主要使用开源手艺，我期待这一趋势从咫尺运行握续发展……共同勇猛于将 AI 的福祉带给全球的每一个东说念主。

爱范儿 |原文结伴 ·稽查驳斥 ·新浪微博【RKI-084】ザーメンベストの金字塔ザーメン大好き2000発 24時間

【RKI-084】ザーメンベストの金字塔 ザーメン大好き2000発 24時間 赶超 GPT-4o，最高大模子 Llama 3.1 405B 通宵封神，扎克伯格：开源引颈新时期

【RKI-084】ザーメンベストの金字塔ザーメン大好き2000発 24時間赶超 GPT-4o，最高大模子 Llama 3.1 405B 通宵封神，扎克伯格：开源引颈新时期