O echipă de specialişti din mai multe domenii a realizat o resursă online, bazată pe Atlasul genomului cancerului, disponibilă gratuit pentru oamenii de ştiinţă, astfel încât aceştia să poată clasifica mai bine subtipurile de cancer în vederea diagnosticului.
Resursa este considerată utilă deoarece tumorile aparţinând unor tipuri diferite pot avea răspunsuri diferite la terapiile pentru cancer.
Atlasul genomului cancerului (TCGA) a colectat şi analizat informaţii genetice de la mii de pacienţi cu cancer şi boli genetice.
Într-un articol publicat la începutul anului 2025 în "Cancer Cell", iniţiatorii resursei afirmă că aceasta este primul instrument menit să faciliteze implementarea clinică a cunoştinţelor cuprinse în baza de date uriaşă a TCGA.
"TCGA a definit subtipuri moleculare pentru fiecare tip major de cancer. Cu această resursă, ne-am propus să oferim comunităţilor clinice şi ştiinţifice instrumentele pentru a clasifica o tumoră nou diagnosticată într-unul dintre aceste subtipuri", a declarat dr. Peter W. Laird, de la catedra de epigenetică a Institutului Van Andel, citat de sciencedaily.com.
Resursa este considerată suficient de puternică pentru a crea evaluări clinice bazate pe variaţiile moleculare între subtipurile de cancer.
Atlasul TCGA a însemnat un efort care a durat un deceniu, sub coordonarea Institutului Naţional al Cancerului din SUA, şi conţine hărţi moleculare detaliate pentru 33 de tipuri de cancer.
Spre deosebire de abordările tradiţionale, care definesc tipurile de cancer pe baza organelor sau ţesuturi în care apar, TCGA se bazează pe caracteristici nuanţate genomice, epigenomice, proteomice şi transcriptomice, ce definesc mult mai precis subtipurile de cancer.
Noua resursă a pornit de la numeroasele solicitări primite de cercetătorii implicaţi în realizarea TCGA de la medici, care cereau ajutor pentru a clasifica precis probele de la pacienţi.
Acest lucru a fost determinat de complexitatea TCGA, în condiţiile în care multe subtipuri moleculare din cadrul atlasului au fost generate utilizând sute sau chiar mii de caracteristici de la diverse tipuri de date.
Pornind de la aceste solicitări, echipa a creat o resursă care simplifică utilizarea datelor din TCGA. Astfel, resursa a valorificat date din 8.791 de mostre de cancer, din 26 de cohorte de pacienţi cu cancer şi 106 subtipuri de cancer.
Ulterior, cercetătorii au folosit instrumente de machine learning pentru a dezvolta şi testa aproape jumătate de milion de modele din şase categorii: expresie a genelor, metilarea ADN, miARN, număr de copii, mutaţii şi "multi-om-ică" (o abordare biologică bazată pe multiple domenii cu terminaţie în "om" - genom, microbiom, proteom, transcriptom etc).
Dintre acestea, cercetătorii au selectat modelele care s-au comportat cel mai bine şi le-au inclus în resursa online.
În total, resursa conţine 737 modele gata de a fi folosite, reprezentând modelele cele mai reprezentative pentru fiecare dintre cele 26 de cohorte de pacienţi cu cancer, cinci algoritmi de training şi şase tipuri de date. Mai mult, aceste modele pot fi folosite de alţi cercetători pentru a genera noi seturi de date.
Resursa online este disponibilă în următorul link: https://github.com/NCICCGPO/gdan-tmp-models.