
新浪科技讯 4月30日下昼音讯kaiyun官方网站,DeepSeek当天于AI开源社区Hugging Face上发布了一个名为DeepSeek-Prover-V2-671B的新模子。
据悉,DeepSeek-Prover-V2-671B 使用了更高效的 safetensors文献门径,并相沿多种计较精度,便捷模子更快、更省资源地熟识和部署,参数达6710亿,或为前年发布的Prover-V1.5数学模子升级版块。
在模子架构上,该模子使用了DeepSeek-V3架构,领受MoE(搀杂民众)样式,具有61层Transformer层,7168维荫藏层。同期相沿超长高下文,最大位置镶嵌达163840,使其能惩处复杂的数学讲解,况兼领受了FP8量化,可通过量化时期减小模子大小,进步推理成果。
海量资讯、精确解读,尽在新浪财经APP
拖累裁剪:何俊熹 kaiyun官方网站
