Cercetătorii americani au dezvoltat un model de învăţare automată bazat pe algoritmi inteligenţi, pentru a valida un model de cercetare care permite utilizarea informaţiilor medicale fără divulgarea datelor pacienţilor.
Cercetătorii de la Penn Medicine şi Intel Corporation din Statele Unite au condus cel mai mare studiu de până acum pentru a agrega în siguranţă şi fără a divulga datele pacienţilor informaţiile obţinute prin scanarea creierului a 6.314 de pacienţi cu glioblastom (GBM) din 71 de centre medicale de pe tot globul.
Folisind tehnologia de învăţare automată (deep learning) cercetătorii au dezvoltat un model nou, la scară globală, care poate îmbunătăţi cunoştinţele în trei subcompartimente tumorale, fără a compromite intimitatea pacientului.
Realizările au fost publicate luni, în Nature Communications.
„Acesta este cel mai mare şi mai divers set de date despre pacienţii cu glioblastom considerat vreodată în literatura de specialitate”, a declarat autorul principal, lect. univ. dr. Spyridon Bakas, profesor de patologie şi medicină de laborator şi radiologie, la facultatea de medicină Perelman a universităţii din Pennsylvania.
„Cu cât putem introduce mai multe date în modelele de învăţare automată, cu atât acestea devin mai precise, ceea ce ne poate îmbunătăţi capacitatea de a înţelege, trata şi elimina glioblastomul la pacienţi, cu mai multă precizie”, a precizat profesorul.
Cercetătorii care studiază afecţiuni rare, cum este glioblastomul, un tip agresiv de tumoră cerebrală, au adesea populaţii de pacienţi limitate în funcţie de clinică sau localizarea geografică.
Din cauza legislaţiei privind protecţia vieţii private, cum ar fi Legea privind portabilitatea şi responsabilitatea asigurărilor de sănătate din 1996 (HIPAA) în Statele Unite şi Regulamentul general privind protecţia datelor (GDPR) în Europa, colaborările pentru partajarea datelor între instituţii fără a compromite datele privind confidenţialitatea pacienţilor reprezintă un obstacol major, pentru mulţi furnizori de servicii medicale.
O abordare mai nouă de învăţare automată, numită federated learning (o modalitate de a antrena modele de IA fără ca nicio persoană să vadă sau să atingă datele respective), oferă o soluţie la aceste obstacole.
Federated learning, o abordare implementată pentru prima dată de Google pentru funcţia autocorect, antrenează un algoritm de învăţare automată pe mai multe dispozitive sau servere descentralizate (în acest caz, instituţii) care deţin local mostre de date, fără a exista un schimb efectiv între aceste date.
S-a demonstrat anterior că metoda permite clinicienilor din instituţii din diferite ţări să colaboreze la cercetare, fără însă a partaja datele private despre pacienţi.
„Acest tip de informaţii ajută cercetarea, în special în cazurile rare de cancer, unde datele disponibile pot fi limitate.
Abordarea federated learning pe care o descriem permite accesul la date, reducând în acelaşi timp povara instituţională pentru partajarea datelor”. a precizat Jill Barnholtz-Sloan, profesor adjunct la facultatea de medicină a universităţii Case Western Reserve din Statele Unite.
Privind în perspectivă, autorii speră că, datorită metodologiei generice, aplicaţiile noului model în cercetarea medicală pot fi de anvergură, aplicându-se nu numai altor tipuri de cancer, ci şi altor afecţiuni.
Ei anticipează, de asemenea, mai multe cercetări pentru a demonstra că tehnologia poate respecta protocoalele de securitate şi confidenţialitate din întreaga lume.