Umělá inteligence a strojové učení v enzymovém inženýrství

Se zásadní publikací, která představuje problematiku a přístupy ke strojovému učení (angl. machine learning) v oblasti enzymového inženýrství, přišel kolektiv autorů z Loschmidtových laboratoří a výzkumného týmu Proteinové inženýrství (PEG) Mezinárodního centra klinického výzkumu Fakultní nemocnice u sv. Anny v Brně.

Autoři Dr. Stanislav Mazurenko, prof. RNDr. Zbyněk Prokop Ph.D. a prof. Dr. Mgr. Jiří Damborský, v publikaci popisují současný stav této problematiky, komentují současná omezení a výzvy, kterým vědecká komunita v této oblasti čelí. Věnují se také pokroku v experimentálních a teoretických metodách, které mají potenciál tyto výzvy řešit. Představují také svůj pohled na možné budoucí směry vývoje aplikací k návrhu účinných biokatalyzátorů.

Enzymové inženýrství je proces tvorby nových biokatalyzátorů se zlepšenými vlastnostmi změnou sekvence aminokyselin těch stávajících. Dvě zavedené a široce používané strategie jsou racionální design a řízená evoluce, které vykazují dobré výsledky, nicméně vyžadují značné množství výpočetní či experimentální práce při každé konkrétní optimalizaci biokatalyzátoru. „Strojové učení je novým přístupem k navrhování nových biokatalyzátorů, založeným na analýze vstupních dat a identifikaci opakujících se vzorů. Odborná komunita má veliká očekávání z využití těchto metod v designu biokatalyzátorů a biofarmaceutik“ řekl Stanislav Mazurenko (na fotografii).

Velmi zjednodušeně se tak dá popsat celý proces tak, že na základě známých vlastností – ať už tepelné stability, reakční rychlosti či substrátové specifity – řady proteinů dokáže počítač s určitou pravděpodobností odhadnout vlastnosti nového proteinu. Už z těchto základních strukturních dat se počítač dokáže „naučit“, jak se vlastnosti změní, pokud dojde k té či oné změně. Proto strojové učení na jiném biokatalyzátoru pak tyto „znalosti“ aplikuje a odhadne, jaké vlastnosti bude mít výsledek po změně jedné aminokyseliny na určitě pozici. „Aplikace strojového učení v designu proteinu je mladá, ale nesmírně dynamická a perspektivní oblast výzkumu. Nové teoretické metody významně omezí počet proteinových variant, které by se jinak musely za vynaložení nemalých finančních prostředků a času realizovat experimentálně,“ dodal Jiří Damborský.

Loschmidtovy laboratoře a výzkumný tým PEG jsou v této oblasti výzkumu na světové úrovni a proto také v publikaci nastiňují směry vývoje, kterým se budou nadále věnovat, ať už jde o umělé neuronové sítě či nové experimentální techniky. A výzvy to jsou opravdu nemalé, vždyť například v mezinárodní proteinové databázi je popsáno „pouze“ 145 000 struktur proteinů z odhadovaného počtu více než 215 milionů možných. Článek se během několika týdnů dostal mezi 5 % nejsledovanějších publikací podle Altmetric metriky sledující celosvětově citace na sociálních sítích.

Článek naleznete zde. 

 

Stanislav-Mazurenko