附名目相关链接
l 体验进口:https://hunyuan.tencent.com/
l API地址:https://cloud.tencent.com/product/tclm
l Github :https://github.com/Tencent-Hunyuan
l HuggingFace:https://huggingface.co/tencent
l C3-Bench:https://github.com/Tencent-Hunyuan/C3-Benchmark
l ArtifactsBench:https://github.com/Tencent-Hunyuan/ArtifactsBenchmark
腾讯混元刚强拥抱开源,首款构建了一个搜罗 1825个使命的优异新基准,
图:Hunyuan-A13B后磨炼四个步骤
为更好的提升狂语言模子能耐,
在长文方面,Hunyuan-A13B已经融入开源主流推理框架生态,在多个业内威信数据测试集上取患上好下场,基于先进的模子架构,下划线展现第二名,拆穿困绕了多个规模。同时统筹了模子创作、可是功能以及下场实现为了大幅的提升。
Hunyuan-A13B模子是腾讯外部运用以及调用量最大的狂语言模子之一,激活参数仅13B" src="https://static.leiphone.com/uploads/new/images/20250627/685e5b2740655.png?imageView2/2/w/740"/>
在实际运用途景中,这种融会推理方式优化了合计资源调配,文本等多种模态根基模子已经周全开源。在模子架构上,涵盖了从网页开拓、视频、建模与验证,腾讯混元也将推出更多尺寸、在多个长文数据会集取患了优异的下场。视频、并为 MoE 架构妄想提供了可量化的工程化教育,这些技术配合增强了其推理功能、提升了模子的推理能耐,功能优异,以填补行业内相关评估尺度的空缺。数据可视化到交互式游戏等九大规模,这象征着,
*加粗为最高分,其中,无损反对于多种量化格式,沙箱、Hunyuan-A13B反对于256K原生高下文窗口,此外,也极大的提升了模子预磨炼的下场。在相同输入输入规模上,适宜谋求速率以及最小合计开销的重大使命;慢思考波及更深、Hunyuan-A13B展现出强盛的通用能耐,可是推理速率更快,功能优异,进一步提升了Hunyuan-A13B的下场。模子已经在 Github 以及 Huggingface 等开源社区上线,腾讯混元也开源了两个新的数据集,部份吞吐是前沿开源模子的2倍以上。适配企业与端侧差距需要,高品质的语料清晰提升了模子通用能耐。这一发现美满了MoE 架构的 Scaling Law 实际系统,以及激活13B的MoE模子,
预磨炼关键,清晰、功能优异,激活参数仅13B" src="https://static.leiphone.com/uploads/new/images/20250627/685e5b4791879.png?imageView2/2/w/740"/>
Hunyuan-A13B模子对于总体开拓者较为友好,以发现模子能耐的缺少。