Nyhet· Niklas

DeepSeek V4 Pro med 1,6 biljoner parametrar lanseras med stöd för Huawei Ascend

DeepSeek har släppt två nya modeller: V4 Pro med 1,6 biljoner parametrar och Flash med 284 miljarder parametrar. Båda finns i Base- och Instruct-varianter och är optimerade för att köras på Huawei Ascend-chips.

Modellerna använder en gles MoE-arkitektur (Mixture of Experts) där bara en bråkdel av parametrarna aktiveras per token. V4 Pro aktiverar 49 miljarder parametrar per forward pass (1,6T-A49B) och Flash aktiverar 13 miljarder (284B-A13B). Det gör dem mer beräkningseffektiva än täta modeller av motsvarande storlek.

Stödet för Huawei Ascend är strategiskt viktigt. Det ger ett konkret alternativ till Nvidia-hårdvara för den som vill köra eller finjustera DeepSeeks modeller, något som är särskilt relevant för aktörer med begränsad tillgång till Nvidia-chip på grund av exportrestriktioner.

Enligt Latent Space är V4 Pro inte längre benchmarks-ledare, trots sin storlek. Modellerna är ändå anmärkningsvärda för sin hårdvarustrategi och sin öppna tillgänglighet i både Base- och Instruct-format.