GPT-Rosalind: OpenAI:s modell stör biomedicinsk forskning

  • GPT-Rosalind är OpenAI:s första modell som specialiserar sig på livsvetenskap och biomedicin
  • Systemet accelererar tidiga stadier av läkemedelsutveckling genom evidenssyntes och hypotesgenerering
  • Den integrerar mer än 50 vetenskapliga verktyg och databaser och erbjuds med begränsad åtkomst på grund av biosäkerhet.
  • OpenAI samarbetar redan med läkemedelsföretag och forskningscentra för att tillämpa modellen på verkliga arbetsflöden.

GPT-Rosalind

Framväxten av alltmer specialiserade modeller för artificiell intelligens för specifika sektorer förändrar den vetenskapliga forskningens inriktning. I detta sammanhang, OpenAI har presenterat GPT-Rosalind, ett AI-system inriktat på livsvetenskaper som strävar efter att bli ytterligare en del av maskineriet i biomedicinska laboratorier, och inte bara ett allmänt verktyg.

Denna nya modell kommer vid en tidpunkt då forskning inom biomedicin och Läkemedelsutveckling står inför höga kostnader och långa ledtider och en lavin av data som är svår att hantera med traditionella metoder. OpenAIs förslag är beläget just där: ett vetenskapligt resonemangssystem som kan bidra till att förkorta de tidiga stadierna av läkemedelsutveckling och hantera mycket teknisk information, med särskild uppmärksamhet på säkerhet och åtkomstkontroll.

Vad är GPT-Rosalind och varför är den uppkallad efter Rosalind Franklin?

GPT-Rosalind är en modell för artificiell intelligens utvecklad av OpenAI med tydligt fokus på biologi, biokemi och translationell medicinDess namn är en hyllning till Rosalind Franklin, den brittiska forskaren vars arbete var nyckeln till att reda ut DNA:ts struktur, en symbolisk referens som understryker systemets inriktning mot analys av molekylära strukturer och komplexa biologiska data.

Till skillnad från generella språkmodeller har GPT-Rosalind utformats som ett verktyg för specialiserat vetenskapligt resonemangDen är utformad för att fungera med akademisk litteratur, biomedicinska databaser och experimentella resultat. Målet är att den ska prestera mer robust i uppgifter som proteinförståelse, DNA-sekvensanalys och tolkning av kemiska reaktioner, och därmed övervinna begränsningarna hos tidigare generationer av AI inom fysik och kemi.

OpenAI placerar denna lansering inom en bredare diversifieringsstrategi, där dess modeller går bort från att enbart fokusera på allmän användning för den breda allmänheten och mot vertikala lösningar för specifika branscher, inklusive läkemedel, bioteknik och ledande biomedicinska forskningscentra i Europa och resten av världen.

En modell utformad för laboratorie- och läkemedelsutveckling

Kärnan i GPT-Rosalind ligger i dess förmåga att stödja forskare genom hela den inledande läkemedelsutvecklingscykeln. Enligt OpenAI är modellen optimerad för synkronisera fyra nyckelfunktionersyntes av bevis, generering av hypoteser, experimentell planering och stöd för flerstegsundersökningar.

I praktiken innebär detta att ett vetenskapligt team kan använda modellen för att sök snabbt i databaserDetta innebär att filtrera den senaste litteraturen, identifiera mönster i tidigare resultat och föreslå nya experiment inriktade på ett specifikt terapeutiskt mål. Där läkemedelsutvecklingscyklerna kan överstiga tio år, menar företaget att automatisering av dessa tidiga stadier skulle kunna förkorta tidslinjerna och minska antalet misslyckade kandidater som når kliniska prövningar.

Förutom att generera text presenterar sig GPT-Rosalind som ett verktyg som kan hjälpa till med uppgifter som proteindesign eller kemiska föreningar med specifika egenskaperDetta är ett område med direkta konsekvenser för läkemedelsindustrin. Löftet är att modellen kommer att hjälpa till att simulera molekylära interaktioner och utesluta metoder med låg sannolikhet för framgång innan man investerar åratal av laboratoriearbete och betydande ekonomiska resurser.

Vetenskaplig prestanda och förbättringar jämfört med tidigare modeller

I de interna utvärderingar som OpenAI har släppt visar GPT-Rosalind märkbara förbättringar jämfört med tidigare versioner av deras modeller i biologi och kemi. Testerna sträcker sig från att förstå proteinstrukturer och DNA-sekvenser till kemiska reaktioner och nukleinsyrafunktioner.

En av de mest slående uppgifterna kommer från försök som utförts med aktiva forskare: modellen skulle ha nått en prestation överlägsen de flesta mänskliga experters I vissa övningar som förutsäger RNA-sekvensers funktioner uppnådde OpenAI poäng över 95 % av deltagarna i just dessa tester. Även om OpenAI inte beskriver hela metoden för utvärderingarna, betonar de att målet inte är att ersätta forskningspersonal, utan att erbjuda ett verktyg som utökar deras analytiska förmåga.

Denna prestationsökning återspeglas även i grundläggande biologi- och kemiprov, där GPT-Rosalind har förbättrat sina resultat avsevärt jämfört med tidigare. För den europeiska biomedicinska sektorn, som konkurrerar i en högt specialiserad global miljö, att ha AI-modeller som kan förstå kemisk och biologisk logik Med större precision kan det göra skillnad både vad gäller tid och kvalitet på de erhållna resultaten.

Integration med databaser och vetenskapliga verktyg

En av de utmärkande egenskaperna hos GPT-Rosalind är dess integration med ett brett ekosystem av forskningsverktyg. OpenAI har tillkännagivit en specifikt tillägg för biovetenskap som kopplar modellen till fler än 50 datakällor och vetenskapliga verktyg, utformade för att göra det möjligt för forskare att arbeta från ett enda gränssnitt.

Viktiga funktioner inkluderar möjligheten att konsultera proteinstrukturer, söka efter DNA-sekvenser i specialiserade databaser, granska aktuella vetenskapliga artiklar och koppla experimentella resultat till prediktiva modeller. Målet är att förhindra att team behöver växla mellan flera plattformar, vilket minskar den fragmentering som ofta kännetecknar arbete inom biomedicin.

Denna integration bygger på OpenAI:s egen infrastruktur: GPT-Rosalind har byggts på företagets mest avancerade interna modeller Det erbjuds som en förhandsvisning av forskningen via ChatGPT, Codex och API:et, inom ett betrodd åtkomstdistributionsschema. Samtidigt har ett gratis plugin för biovetenskaplig forskning för Codex lanserats, riktat mot programmerare och datavetare som behöver automatisera uppgifter i sina analysrör.

Begränsad åtkomst och biosäkerhet som prioritet

Till skillnad från andra populära OpenAI-produkter har GPT-Rosalind inte släppts som en öppen tjänst för någon användare. Företaget har etablerat ett system med begränsad åtkomst, riktad mot verifierade forskningsorganisationer och kunder som uppfyller vissa säkerhetskrav.

Detta beslut är ett svar på växande oro kring biosäkerhet och missbruk av avancerade modeller inom biologin. AI:s förmåga att hjälpa till vid utformning av nya föreningar eller manipulation av genetiskt material kräver införandet av ytterligare skyddsåtgärder, något som är särskilt känsligt för Europeiska unionen, som upprätthåller strikta regler för dataskydd och biologiska risker.

I sitt tillkännagivande betonade OpenAI att användningen av GPT-Rosalind åtföljs av specifika protokoll för hantering av vetenskapliga data, med kontroller över vem som kan komma åt systemet och för vilka ändamål. Denna metod placerar det i en liknande kategori som andra högriskmodeller, där professionell och övervakad användning prioriteras framför masstillgänglighet.

Samarbete med läkemedels-, bioteknik- och institutionella företag

GPT-Rosalind testas redan i verkliga arbetsmiljöer i samarbete med flera företag inom läkemedels- och biotekniksektorn. Bland de första partnerna finns namn som Amgen, Moderna, Thermo Fisher Scientific och Allen Institute, bland andra ledande aktörer inom biomedicinsk forskning.

Dessa organisationer arbetar med modellen för att integrera den i sina forskningsflöden, från att identifiera terapeutiska mål till att analysera prekliniska data. I Europa, där stora läkemedelskoncerner och biomedicinska excellenscentra försöker stärka sin globala konkurrenskraft, passar tillämpningen av verktyg som GPT-Rosalind in i trenden att kombinera automatisering, storskalig dataanalys och algoritmisk resonemang i vetenskapligt beslutsfattande.

Utöver läkemedelsindustrin föreslår OpenAI att modellen skulle kunna vara användbar för akademiska institutioner, offentliga laboratorier och translationella forskningskonsortier, som ofta står inför uppgiften att tolka stora biologiska databaser med begränsade resurser. Företaget har också kopplat denna utveckling till en bredare AI-investeringsstrategi för hälso- och sjukvård, med finansieringsåtaganden som överstiger en miljard dollar för relaterade projekt.

Ännu ett steg i specialiseringen av artificiell intelligens

Lanseringen av GPT-Rosalind är också symptomatisk för en djupare förändring i AI-ekosystemet: övergången från generalistmodeller till vertikala system, finjusterade för lösa specifika problem inom specifika branscherInom livsvetenskaperna ligger utmaningen inte bara i att bearbeta naturligt språk, utan också i att tolka experimentella data, hantera farmakologiska och molekylärbiologiska begrepp och koppla samman olika resultat till ett sammanhängande ramverk.

I detta scenario går AI från att vara ett perifert stödverktyg till att integreras i forskningens hjärta, där det deltar i hypotesgenerering, prioritering av experiment och utvärdering av resultat. För europeiska laboratorier, vana vid långa tidslinjer och höga misslyckandefrekvenser inom läkemedelsutveckling, är möjligheten att automatisera en del av det mer repetitiva intellektuella arbetet Och att filtrera information mer exakt öppnar upp för nya spelplaner.

Allt tyder på att utvecklingen för GPT-Rosalind och liknande modeller kommer att vara en viktig indikator på hur förhållandet mellan vetenskap, industri och reglering utvecklas under de kommande åren. I takt med att samarbeten med läkemedelsföretag, akademiska institutioner och offentliga organ blir mer etablerade kommer vi att se i vilken utsträckning dessa system kan omsätta sin potential i konkreta framsteg, både för klinisk praxis och för grundläggande biomedicinsk forskning.

Manuel Ujaldón (till vänster) tillsammans med andra ibero-amerikanska datorexperter
Relaterad artikel:
Intervju med Manuel Ujaldón Martínez: NVIDIA CUDA Fellow-pris