Jaeaiot捷易科技-日本在线一区二区三区-英伟达AI显卡模组/日本在线天堂/GPU整机服务器供应商

Meta 推出 Llama 3.1:開源 AI 的新時代
發布時間: 2024-08-08 16:17

Llama 3.1 帶來新突破

上個月底,Meta推出了Llama 3.1 大型語言模型 (LLM) 系列。它由三個新模型組成——預先訓練和指令調整的文本輸入/文本輸出開源生成式 AI 模型,參數數量分別為 8B、70B 和 405B。


據 Meta 稱,旗艦 405B 版本是“全球最大、功能最強大的公開可用基礎型號”。


開源方法和創新


首席執行官馬克·扎克伯格 (Mark Zuckerberg) 倡導開源方法,并預測它最終將成為行業標準,就像 Linux 之于操作系統一樣。他斷言,與專有的閉源模型相比,開源 AI 模型不僅發展更快,而且具有更大的創新潛力。


Llama 3.1 的發布確實為全球 AI 社區注入了活力,圍繞其潛力展開了大量討論和探索。以下是您需要了解的內容!


先前的目標和最近的成就


今年早些時候,當第一款體型較小的 Llama 3 模型(Llama 2)發布時,Meta表示其近期目標是“讓 Llama 3 具備多語言和多模式能力,擁有更長的語境,并繼續提高推理和編碼等 LLM 功能的整體性能”。


借助 Llama 3.1,它朝著實現這一目標邁出了一大步。LLM 尚未實現多模式,但它確實擁有新的多語言功能(西班牙語、葡萄牙語、意大利語、德語和泰語),以及擴展的工具使用和大幅增加的上下文長度。405B 模型使用超過 16,000 個 NVIDIA H100 GPU 在 15 萬億個標記的海量數據集上進行訓練,比其前代模型復雜得多,功能也強大得多。


性能基準


Meta表示,Llama 3.1 405B 在多項基準測試中的表現優于 OpenAI 的 GPT-4 和 GPT-4o 以及 Anthropic 的 Claude 3.5 Sonnet。據報道,在一系列不同的任務中,它與其閉源競爭對手“不相上下”。


以下是 405B 模型與其他常用基準的尖端 LLM 的比較(未包括 Gemini,因為 Meta 難以使用Google的 API 來復制其結果):




模型架構和設計


在介紹 Llama 3.1的博客中,Meta 指出該模型的完整訓練堆棧“得到了顯著優化”。設計選擇優先考慮了模型開發過程的可擴展性和簡單性。


例如,為了最大限度地提高訓練穩定性,Llama 3.1 使用標準的僅解碼器的 Transformer 模型架構,并進行了細微調整,而不是混合專家模型。Meta 還采用了迭代后訓練程序,每輪都使用監督微調和直接偏好優化。結果是每次迭代都會創建出高質量的合成數據,從而增強了每項功能的性能。


405B 模型本身甚至被用來提高較小的 70B 和 8B 模型的訓練后質量。


值得注意的是,為了便于對 405B 規模的模型進行大規模生產推理,Meta 從 16 位 (BF16) 轉換為 8 位 (FP8) 數值。這有效地降低了計算要求并使模型能夠在單個服務器節點內運行。


用戶現在還可以享受更長的上下文窗口。Llama 3.1 模型的上下文長度已從 Llama 3 中的 8,192 個標記擴展到 Llama 3.1 中的 128,000 個標記。這大約是原來的 16 倍!


事實上,擴展的上下文長度現在比 GPT-4 大得多,大約等于企業用戶使用 GPT-4o 獲得的長度,并且與 Claude 3 的 200,000 個標記窗口相當。


最重要的是,高需求時期不會影響訪問,因為 Llama 3.1 可以部署在您自己的硬件或所選的云提供商上。一般來說,也不會有廣泛的使用限制。


使用和構建 Llama 3.1 405B


作為一款如此強大的機型,405B 需要大量的計算資源和開發人員的專業知識才能使用。Meta 明確表示,它希望用戶能夠充分利用它——利用其先進的功能并立即開始構建。以下是一些可能性:


  • 實時和批量推理

  • 監督微調,包括特定領域

  • LLM-as-a-judge(評估你的模型是否適合你的具體應用)

  • 持續預訓練

  • 檢索增強生成 (RAG)

  • 函數調用

  • 合成數據生成


Meta 生成 AI 副總裁 Ahmad Al-Dahle預測,知識提煉將成為開發人員對 405B 模型的流行用途。也就是說,它可以用作更大的“教師”模型,將其知識和新興能力提煉成更小的“學生”模型,具有更快、更經濟的推理能力。


另一個例子:Al-Dahle 表示,Llama 3.1 可以與搜索引擎 API 集成,以“根據復雜的查詢從互聯網上檢索信息,并連續調用多個工具以完成您的任務。”如果您要求該模型繪制過去五年內售出的房屋數量,“它可以為您檢索[網絡]搜索并生成 Python 代碼并執行它。”還不錯。


Llama 生態系統還為各種用例和高級工作流程提供了交鑰匙指南,供任何人使用。Meta 已與 vLLM、TensorRT 和 PyTorch 等項目合作,從一開始就提供支持,讓用戶更容易上手。


未來趨勢


最終,Llama 3.1 代表了追求開放、可訪問和負責任的 AI 創新的重要飛躍。


在捷智算平臺,我們非常欣賞這些開大規模語言模型的可訪問性,以及周圍社區的合作。我們自己的使命與讓人工智能惠及每個人的理念相一致。


為此,我們很高興能夠在捷智算平臺上提供開源文本生成接口 (TGI) 框架,這樣您就可以提供像 Llama 3.1 這樣的 LLM,并以更實惠的計算成本運行您自己的模型。

粵公網安備 44030502006483號、 粵ICP備15047669號
  • 捷易科技聯系人
  • 主站蜘蛛池模板: 外贮压-柜式-悬挂式-七氟丙烷-灭火器-灭火系统-药剂-价格-厂家-IG541-混合气体-贮压-非贮压-超细干粉-自动-灭火装置-气体灭火设备-探火管灭火厂家-东莞汇建消防科技有限公司 | 铝合金风口-玻璃钢轴流风机-玻璃钢屋顶风机-德州东润空调设备有限公司 | 搬运设备、起重设备、吊装设备—『龙海起重成套设备』 | 连续油炸机,全自动油炸机,花生米油炸机-烟台茂源食品机械制造有限公司 | 滚塑PE壳体-PE塑料浮球-警示PE浮筒-宁波君益塑业有限公司 | 交变/复合盐雾试验箱-高低温冲击试验箱_安奈设备产品供应杭州/江苏南京/安徽马鞍山合肥等全国各地 | 自进式锚杆-自钻式中空注浆锚杆-洛阳恒诺锚固锚杆生产厂家 | 钢化玻璃膜|手机钢化膜|钢化膜厂家|手机保护膜-【东莞市大象电子科技有限公司】 | 石牌坊价格石牌坊雕刻制作_石雕牌坊牌楼石栏杆厂家_山东嘉祥石雕有限公司 | 校园气象站_超声波气象站_农业气象站_雨量监测站_风途科技 | 大流量卧式砂磨机_强力分散机_双行星双动力混合机_同心双轴搅拌机-莱州市龙跃化工机械有限公司 | 整合营销推广|营销网络推广公司|石家庄网站优化推广公司|智营销 好物生环保网、环保论坛 - 环保人的学习交流平台 | 网站建设,北京网站建设,北京网站建设公司,网站系统开发,北京网站制作公司,响应式网站,做网站公司,海淀做网站,朝阳做网站,昌平做网站,建站公司 | 气动|电动调节阀|球阀|蝶阀-自力式调节阀-上海渠工阀门管道工程有限公司 | 英超直播_英超免费在线高清直播_英超视频在线观看无插件-24直播网 | 培训中心-海南香蕉蛋糕加盟店技术翰香原中心官网总部 | 诸城网站建设-网络推广-网站优化-阿里巴巴托管-诸城恒泰互联 | 针焰试验仪,灼热丝试验仪,漏电起痕试验仪,水平垂直燃烧试验仪 - 苏州亚诺天下仪器有限公司 | 真空搅拌机-行星搅拌机-双行星动力混合机-广州市番禺区源创化工设备厂 | 地磅-地秤-江阴/无锡地磅-江阴天亿计量设备有限公司_ | 原子吸收设备-国产分光光度计-光谱分光光度计-上海光谱仪器有限公司 | 医院专用门厂家报价-医用病房门尺寸大全-抗菌木门品牌推荐 | 合肥触摸一体机_触摸查询机厂家_合肥拼接屏-安徽迅博智能科技 | CCE素质教育博览会 | CCE素博会 | 教育展 | 美育展 | 科教展 | 素质教育展 | 口信网(kousing.com) - 行业资讯_行业展会_行业培训_行业资料 | 海峰资讯 - 专注装饰公司营销型网站建设和网络营销培训 | 美国查特CHART MVE液氮罐_查特杜瓦瓶_制造全球品质液氮罐 | PU树脂_水性聚氨酯树脂_聚氨酯固化剂_聚氨酯树脂厂家_宝景化工 | 岛津二手液相色谱仪,岛津10A液相,安捷伦二手液相,安捷伦1100液相-杭州森尼欧科学仪器有限公司 | 电线电缆厂家|沈阳电缆厂|电线厂|沈阳英联塑力线缆有限公司 | 定量包装秤,吨袋包装称,伸缩溜管,全自动包装秤,码垛机器人,无锡市邦尧机械工程有限公司 | 聚合氯化铝_喷雾聚氯化铝_聚合氯化铝铁厂家_郑州亿升化工有限公司 | 齿轮减速机_齿轮减速电机-VEMT蜗轮蜗杆减速机马达生产厂家瓦玛特传动瑞环机电 | 【黄页88网】-B2B电子商务平台,b2b平台免费发布信息网 | 健身器材-健身器材厂家专卖-上海七诚健身器材有限公司 | 首页-瓜尔胶系列-化工单体系列-油田压裂助剂-瓜尔胶厂家-山东广浦生物科技有限公司 | 电子天平-华志电子天平厂家| 【化妆品备案】进口化妆品备案流程-深圳美尚美化妆品有限公司 | 【德信自动化】点胶机_全自动点胶机_自动点胶机厂家_塑料热压机_自动螺丝机-深圳市德信自动化设备有限公司 | 荣事达手推洗地机_洗地机厂家_驾驶式扫地机_工业清洁设备 | 手术示教系统-数字化手术室系统-林之硕医疗云智能视频平台 |