Un nou instrument îmbunătăţeşte identificarea genelor care provoacă boli

Un nou instrument îmbunătăţeşte identificarea genelor care provoacă boli

Un nou instrument statistic, dezvoltat de cercetătorii americani, îmbunătăţeşte capacitatea de a identifica variantele genetice care provoacă boli.

Instrumentul, descris într-o nouă lucrare publicată vineri, în revista Nature Genetics, combină datele din studiile de asociere la nivelul întregului genom (GWAS) şi predicţiile expresiei genetice pentru a limita numărul de falsuri pozitive şi pentru a identifica cu mai multă precizie genele şi variantele cauzale pentru o boală.

GWAS este o abordare utilizată în mod obişnuit pentru a identifica genele asociate cu o serie de trăsături umane, inclusiv cu cele mai frecvente boli.

Cercetătorii compară secvenţele genomului unui grup mare de persoane cu o anumită boală, de exemplu, cu un alt set de secvenţe de la persoane sănătoase.

Diferenţele identificate în grupul persoanelor cu boli ar putea indica variantele genetice care cresc riscul pentru boala respectivă şi care justifică studii suplimentare.

Cu toate acestea, majoritatea bolilor umane nu sunt cauzate de o singură variaţie genetică.

În schimb, ele sunt rezultatul unei interacţiuni complexe între mai multe gene, factori de mediu şi o serie de alte variabile.

Prin urmare, GWAS identifică adesea multe variante în mai multe regiuni ale genomului care sunt asociate cu o boală.

Totuşi, GWAS este limitat prin faptul că identifică doar asocierea, nu şi cauzalitatea bolilor.

Într-o regiune genomică tipică, multe variante sunt exprem de corelate între ele, datorită unui fenomen numit dezechilibru de legătură. Acest lucru se datorează faptului că ADN-ul este transmis de la o generaţie la alta în blocuri întregi, nu în gene individuale, astfel încât variantele apropiate tind să fie corelate.

„Este posibil să avem multe variante genetice într-un bloc care sunt toate corelate cu riscul de boală, dar nu ştim care este de fapt varianta cauzală", a declarat Xin He, profesor asociat de genetică umană la Universitatea din Chicago şi autor principal al noului studiu.

„Aceasta este provocarea fundamentală a GWAS, şi anume, cum trecem de la asociere la cauzalitate", spune el.

Pentru ca problema să fie şi mai dificilă, majoritatea variantelor genetice sunt localizate în genomuri necodificatoare, ceea ce face ca efectele lor să fie dificil de interpretat.

O strategie comună pentru a aborda aceste provocări este utilizarea nivelurilor de expresie a genelor. Loci de trăsături cantitative de expresie, sau eQTL, sunt variante genetice asociate cu expresia genelor.

Raţionamentul utilizării datelor eQTL este acela că, dacă o variantă asociată cu o boală este un eQTL al unei gene X, atunci X este posibil să fie legătura dintre variantă şi boală.

Cu toate acestea, problema acestui raţionament este că variantele din apropiere şi eQTL-urile altor gene pot fi corelate cu eQTL-ul genei X, afectând în acelaşi timp boala în mod direct, ceea ce duce la un fals pozitiv.

Au fost dezvoltate multe metode pentru a nominaliza genele de risc din GWAS folosind date eQTL, dar toate acestea suferă de această problemă fundamentală de confuzie prin asociaţii apropiate.

De fapt, metodele existente pot genera gene fals pozitive în mai mult de 50% din cazuri.

În noul studiu, echipa din Chicago a dezvoltat o nouă metodă numită studii de asociere cauzală la nivel de transcriptom, sau cTWAS, care utilizează tehnici statistice avansate pentru a reduce ratele fals pozitive.

În loc să se concentreze pe o singură genă la un moment dat, noul model cTWAS ţine cont de mai multe gene şi variante. Utilizând un model Bayesian de regresie multiplă, acesta poate elimina genele şi variantele confuze.

„Dacă ne uităm la câte o genă la un moment dat, putem avea rezultate fals pozitive, dar dacă ne uităm la toate genele şi variantele din apropiere, este mult mai probabil să găsim gena cauzală", spune prof. Xin He.

Lucrarea demonstrează utilitatea acestei noi tehnici prin studierea geneticii nivelului de colesterol LDL.

Ca un exemplu, metodele eQTL existente au nominalizat o genă implicată în repararea ADN-ului, dar noua abordare cTWAS a indicat o variantă diferită în gena ţintă a statinei, un medicament obişnuit utilizat pentru tratarea colesterolului ridicat.

În total, cTWAS a identificat 35 gene cauzale posibile pentru LDL, dintre care mai mult de jumătate nu au fost raportate anterior.

Aceste rezultate indică noi căi biologice şi potenţiale ţinte de tratament pentru LDL.

Software-ul cTWAS este acum disponibil pentru descărcare de pe site-ul laboratorului din Chicago.

Echipa speră să continue să lucreze la el pentru a-i extinde capacităţile de a încorpora alte tipuri de date „omice", cum ar fi splicingul şi epigenetica, precum şi de a utiliza eQTL-uri din mai multe tipuri de ţesuturi.

„Software-ul va permite specialiştilor să facă analize care să conecteze variaţiile genetice la fenotipuri. Aceasta este cu adevărat provocarea cheie cu care se confruntă întregul domeniu", spune profesorul american.

„Acum avem un instrument mult mai bun pentru a face aceste conexiuni", precizează el.

viewscnt