
Den nya generationen språkmodeller från DeepSeek, den kinesiska startupen baserad i Hangzhou, har blivit en av de mest omtalade utvecklingarna inom artificiell intelligens. Deras serie DeepSeek V4 utbrott I en tid av mättnad av erbjudanden och löften, men med ett mycket tydligt budskap: att erbjuda toppnivåfunktioner inom resonemang och agenter, med ett gigantiskt kontextfönster och framför allt med en mycket lägre användarkostnad än sina amerikanska konkurrenter.
Denna lansering är inte en isolerad händelse. Den sker bara några dagar efter nya versioner av ChatGPT och andra stängda modellerOch mitt i Kinas pågående ansträngningar att minska sitt tekniska beroende av väst, kombinerar DeepSeek V4 en öppen källkodsstrategiAggressiv prissättning och en nära allians med Huawei inom hårdvaruområdet kan förändra maktbalansen för europeiska företag som söker billigare och mer kontrollerbara alternativ.
Vad är DeepSeek V4 och hur är det uppbyggt?
DeepSeek V4-familjen består av Språkmodeller för expertblandning (MoE) utformad för att vara mycket effektiv i långsiktiga sammanhang. Företaget talar om en huvudmodell med cirka 1 biljon parametrar totaltdär endast en bråkdel aktiveras i varje token, och en ännu mer ambitiös version, V4-Pro, som når 1,6 biljoner parametrar, med cirka 49.000 miljarder i tillgångar per fråga.
Nyckeln till DeepSeeks MoE-metod är att, även om det totala antalet parametrar är enormt, aktiveras endast tiotals miljarder vid varje inferenssteg. Detta möjliggör drastiskt minska kostnaden för datorkraft och minne jämfört med täta modeller av liknande storlek. Vissa tekniska material nämner ungefär 37.000 miljarder aktiva parametrar per token I en av varianterna passar detta in i idén om extrem effektivitet utan att offra prestanda.
Två varianter: V4-Pro och V4-Flash för olika behov
DeepSeek har segmenterat sitt erbjudande i två huvudmodeller: V4-Pro och V4-FlashV4-Pro är flaggskeppsmodellen, med de tidigare nämnda 1,6 biljoner parametrarna och fokus på djupt resonemang, global kunskap och agentförmågasärskilt inom programmering och komplexa analysuppgifter.
För sin del, V4-Flash presenteras som den lätta och snabba versionenDen har ungefär 284.000 miljarder parametrar totalt och cirka 13.000 miljarder aktiva, och upprätthåller också ett kontextfönster på upp till en miljon tokensDen är utformad för massiva implementeringar, där kostnaden per token, latens och skalbarhet är viktigare än att pressa ut varenda tiondel av benchmarks.
Denna Pro/Flash-dualitet har mer än kommersiell strategi som går utöver enkel teknisk differentieringV4-Pro riktar sig till stora företag, laboratorier och användningsområden där högsta möjliga prestanda krävs; V4-Flash, å andra sidan, syftar till att vara "arbetshästen" för små och medelstora företag, startups och storskaliga tjänster som behöver kompetent och billig AI.
Kontexten för en miljon tokens: vilka förändringar i verklig användning
En av de mest slående funktionerna hos DeepSeek V4 är dess ultralångt kontextfönster på upp till en miljon tokensDetta är långt över de 128 000 tokens som är typiska för många nuvarande affärsmodeller. I praktiken motsvarar detta att kunna arbeta med hundratusentals ord i en enda frågakompletta tekniska manualer, stora koddatabaser, juridiska eller historiska kundtjänstregister utan att behöva fragmentera dem.
Utöver figuren kan detta breda sammanhang minska kostnader och fel som uppstår vid uppdelning av dokumentFärre API-anrop behövs, det finns mindre risk att förlora information mellan skanningar, och designen av produkter som är beroende av stora textvolymer förenklas avsevärt. DeepSeek presenterar modellen inte så mycket som en enkel chatbot, utan som en projektassistent eller en agent som kan planera och sekvensera uppgifter på stora datamängder.
I Europa och Spanien är den här typen av sammanhang särskilt intressant för sektorer som juridisk, finansiell, konsulttjänst, offentlig förvaltning eller hälso- och sjukvårddär det är vanligt att hantera mycket omfattande dokumentation. Utmaningen blir att verifiera om modellen upprätthåller den kapaciteten med rimliga latenser och en verkligt konkurrenskraftig kostnad per miljon tokens i vår produktionsindustri.
Resonemangsförmågor och agenter: satsningen på att konkurrera med slutna system
DeepSeek hävdar att V4-Pro Den överträffar de flesta nuvarande modeller med öppen tak. I tester av global kunskap och resonemang ligger företaget bara något efter några av de bästa modellerna med sluten källkod, såsom de senaste versionerna av Gemini. Inom avancerat resonemang hävdar företaget att de är i nivå med premiumlösningar från OpenAI och Anthropic.
Inom området för agenter och länkade uppgifterDeepSeek V4 har utformats för att fungera som mer än bara en textgenerator. Företaget använder redan V4-Pro internt för datorstödd programmering, arbetsflödesautomation och komplex analys, med idén att modellen kan planera, utföra och verifiera deluppgifter på ett relativt autonomt sätt.
För spanska företag som arbetar med processautomation, mjukvaruutveckling eller dataintensivt backofficeKombinationen av starka resonemang, lång kontext och låg kostnad kan vara attraktiv. Den faktiska mognadsnivån hos V4-agenter och deras robusthet på spanska Dessa är fortfarande aspekter som ska utvärderas i oberoende tester.
Öppen källkod kontra slutna modeller: effekter för Europa
V4-serien presenteras som öppen modell med tidig åtkomstDeepSeek har släppt V4-Pro och V4-Flash på plattformar som Hugging Face i förhandsgranskningsläge, vilket möjliggör testning både i sin egen chatt och via API. Vissa varianter nämner en MIT-liknande licens vilket skulle öppna dörren för lokala nedladdningar och distributioner utan de vanliga begränsningarna för många affärsmodeller.
Denna strategi står i direkt konflikt med strategin för stängda Silicon Valley-modellerOch med de pågående debatterna om hur man ska stänga öppen källkod, där åtkomst ofta är knuten till API-kontrakt, specifika molnleverantörer och högre priser, om DeepSeek V4 bekräftar att prestandagapet mellan öppen och sluten källkod har minskat till nästan noll, kan många europeiska företag komma att ompröva sitt beroende av amerikanska leverantörer.
I EU:s regelverk, präglat av AI-lagen och strikta krav gällande datasuveränitetAtt ha kraftfulla modeller som kan köras lokalt eller i europeiska moln utan att förlora kontrollen över information blir en nyckelfaktor. Kinesisk öppen källkod väcker dock också politiska och förtroenderelaterade frågor som regeringar och stora företag noggrant måste överväga.
Allians med Huawei och alternativ hårdvara till NVIDIA
En av de mest känsliga delarna av DeepSeek V4 är förändring i hårdvarubasenEfter kontroverser kring användningen av NVIDIA H800 GPU:er och till och med anklagelser om användningen av förbjudna Blackwell-chip har företaget stärkt banden med Huawei för att minska sin exponering för amerikanska sanktioner.
Kort efter att ha presenterat V4 tillkännagav Huawei officiellt att de kommer att tillhandahålla sina Ascend-chips och supernodsystem för att utföra DeepSeeks inferensuppgifter. Bland dem sticker acceleratorerna ut. Atlas 350 driven av Ascend 950PR-processorersom har optimerats specifikt för denna typ av MoE-modell och säljs redan som ett lokalt alternativ till NVIDIA-baserad infrastruktur.
Den tekniska dokumentationen för V4 nämner utvecklingen av kärnor anpassade för både Huawei-hårdvara och NVIDIA GPU:erDenna dubbla kompatibilitet skulle göra det möjligt för företaget att överleva potentiella västerländska blockader samtidigt som det utnyttjar styrkan i det kinesiska chipekosystemet. För Europa öppnar detta drag dörren till ett kraftfullt AI-erbjudande som inte är helt knutet till den nordamerikanska leveranskedjan, även om användningen av hårdvara från Kina också kommer att granskas ur ett... cybersäkerhet och strategiskt beroende.
Prissättningsstrategi: effekten på kostnaderna per miljon tokens
DeepSeek har länge positionerat sig som alternativet "billigt resonemang"Det gjorde de redan med sin R1-modell och förstärker nu åtagandet med V4. Enligt uppskattningar som företaget självt och API-leverantörer som redan testar modellen har lagt fram kan kostnaden för inferensen ligga runt 0,30 dollar per miljon tokens, långt under vad många västerländska premiumtjänster tar betalt.
Dessutom hävdar DeepSeek att för Flash-varianten, Den kommer att bibehålla liknande hastigheter som V2-modellen. Lanserades 2024 och har till och med antytt att priserna kan sjunka ytterligare under andra halvåret 2026...i takt med att Huaweis Ascend 950PR-supernoder distribueras i stor skala. Detta tillkännagivande har haft omedelbara effekter på Den kinesiska aktiemarknaden stärker lokala halvledarföretag.
I praktiken, för ett spanskt företag som hanterar långa juridiska dokument, ekonomisk historik eller stora volymer kundinteraktioner, tillåter denna prisstruktur att det arbetar med mycket högre marginaler jämfört med de som erhålls med dyrare API:er. Det återstår dock att se om dessa hastigheter kommer att hålla i sig när V4 lämnar förhandsgranskningsläget och om en del av besparingarna kommer att kompenseras av större implementeringskomplexitet jämfört med mer mogna tjänster.
Tillgänglighet, utvecklingsstatus och åtkomst från Europa
DeepSeek V4 är, enligt företaget själva, i "förhandsgranskningsläge" eller tidig åtkomstV4-Pro-varianten och dess lättare version kan redan testas via den officiella DeepSeek-chatten och via API, medan vissa tredjepartsleverantörer, som t.ex. tredjepartsplattformar som erbjuder testnoderDe har börjat ge begränsad åtkomst till utvecklare.
Företagets färdplan har lidit vissa förseningar jämfört med de ursprungligen läckta datumenvilket pekade på fullständiga utgåvor under första halvåret 2026. Ändå finns det i praktiken redan V4-modeller publicerade i offentliga databaser, redo att testas och driftsättas i laboratoriemiljöer.
För europeiska och spanska organisationer är åtkomsten för närvarande inriktad på Publika API:er, nedladdningar från öppen källkodsdatabaser och testning på internationella molnImplementering på intern infrastruktur kommer att bero på möjligheten att ha kompatibla GPU:er eller, om nödvändigt, godkänd kinesisk hårdvara, vilket kan kollidera med interna säkerhets- och regelefterlevnadskrav.
Konsekvenser för nystartade företag och företag i Spanien och Europa
För den entreprenöriella strukturen i Spanien och andra EU-länder representerar DeepSeek V4 en möjlig demokratisering av tillgången till "företags"-skalemodellerMed mycket lägre kostnader per miljon tokens och möjligheten till lokal exekvering kan projekt som tidigare behövde betydande finansieringsrundor för att täcka kostnader för API:er och GPU:er nu överväga prototyper på hög nivå med mer begränsade resurser.
Inom sektorer som fintech, legaltech, digital hälsa eller dataanalysFörmågan att bearbeta enorma sammanhang och hantera data inom infrastrukturer som kontrolleras av företaget självt kan göra hela skillnaden när det gäller att uppfylla Europeiska dataskyddsförordningarÖvervikten av engelska och kinesiska i officiell dokumentation, liksom prioriteten som ges till dessa språk i utbildning, tyder dock på att Spanska kräver ytterligare finjusteringsarbete för att uppnå verkligt konkurrenskraftiga prestationer.
En annan fråga är mognad av verktygsekosystemet runt DeepSeek V4. Till skillnad från modeller som Llama eller GPT, som har ramverk med öppen källkodVersion 4 börjar med mindre support från början. Företag med små tekniska team kommer att behöva bedöma om de kan hantera den integrationskurvan eller om de föredrar att vänta på att miljön blir mer etablerad.
Geopolitisk och regulatorisk dimension: AI som ett nytt friktionsfält
Framväxten av V4 sker i ett sammanhang där AI är en vektor för ekonomisk och strategisk makt.En öppen och konkurrenskraftig kinesisk modell sätter press på den västerländska berättelsen om teknologiskt ledarskap och ökar spänningen i diskussionen om teknologiska beroenden och globala standarder.
Medan Kina svarar på utmaningen med en industriellt kapacitetserbjudande, proprietära chips och snabb driftsättningEuropa tenderar att stärka den regulatoriska komponenten och kraven på transparens, säkerhet och etik. Möjligheten att öppna modeller av kinesiskt ursprung kan bli globala riktmärken kan uppmuntra europeiska regeringar att höja regulatoriska brandväggarTill exempel inom offentlig upphandling eller kritiska sektorer.
Detta skulle kunna leda till en AI-marknaden fragmenterad av blockI detta sammanhang måste spanska och europeiska företag välja mellan amerikanska modeller som är starkt begränsade av sina egna användningsregler, europeiska lösningar som fortfarande är under utveckling och kraftfulla kinesiska förslag med en komplex geopolitisk komponent. DeepSeek V4, med sin kombination av öppen källkod, låg kostnad och Huawei-stöd, står mitt i debatten.
Sammantaget ser DeepSeek V4 ut att bli en av de mest seriösa utmanarna för att föra övergripande språkmodeller in i öppen källkod och aggressiv prissättningDess enorma kontextfönster, alliansen med alternativ hårdvara till NVIDIA, och fokuset på agenter och resonemang gör det till ett alternativ att följa mycket noga från Spanien och resten av Europa; den verkliga effekten kommer att bero på hur det presterar i produktion, det faktiska stödet på spanska, och i vilken utsträckning företag är villiga att integrera en viktig del av sin AI-infrastruktur från det kinesiska teknikekosystemet.