e-BİLGİ, e-HABER

Microsoft’tan Protein Üreten Yapay Zekâ

microsofttan-protein-ureten-yapay-zeka

Bu Kadar Karmaşık Olmak Zorunda Değil...

15:26:31

Microsoft, Protein Üreten Yeni Bir Yapay Zekâ Olan EvoDiff’i Açık Kaynak Kodlu Olarak Kullanıma Sundu
Microsoft, bir protein dizisine ihtiyaç duymadan protein üretebilen bir yapay zekâ sistemi ve çerçevesi olan EvoDiff’i açık kaynaklı hale getirdi…

Vücutta temel hücresel işlevleri yerine getiren doğal moleküller olan proteinler, tüm hastalıkların yapı taşlarıdır. Proteinlerin karakterize edilmesi, yavaşlatmanın veya potansiyel olarak tersine çevirmenin yolları da dahil olmak üzere bir hastalığın mekanizmalarını ortaya çıkarabilirken, proteinlerin oluşturulması tamamen yeni ilaç ve terapötik sınıflarına yol açabilir…

Ancak laboratuvarda protein tasarlamaya yönelik mevcut süreç hem hesaplama hem de insan kaynakları açısından maliyetlidir. Vücut içinde belirli bir görevi makul bir şekilde yerine getirebilecek bir protein yapısı bulmayı, ardından bu yapıya “katlanması" muhtemel bir protein dizisi – bir proteini oluşturan amino asit dizisi – bulmayı gerektirir. (Proteinler, amaçlanan işlevlerini yerine getirmek için üç boyutlu şekillere doğru şekilde katlanmalıdır).

Bu kadar karmaşık olmak zorunda değil.

Microsoft bu hafta, şirketin bir protein dizisi verildiğinde “yüksek sadakatli“, “çeşitli" proteinler üretebileceğini iddia ettiği genel amaçlı bir çerçeve olan EvoDiff‘i tanıttı. Diğer protein üreten çerçevelerden farklı olarak EvoDiff, hedef protein hakkında herhangi bir yapısal bilgi gerektirmiyor ve tipik olarak en zahmetli adımı aşıyor.

Microsoft kıdemli araştırmacısı Kevin Yang, açık kaynak olarak sunulan EvoDiff‘in yeni terapötikler ve ilaç dağıtım yöntemleri için enzimlerin yanı sıra endüstriyel kimyasal reaksiyonlar için yeni enzimler oluşturmak için kullanılabileceğini söylüyor.

EvoDiff‘in ortak yaratıcılarından Yang, bir e-posta röportajında, “EvoDiff’in protein mühendisliğindeki yetenekleri yapı-fonksiyon paradigmasının ötesinde programlanabilir, sekans öncelikli tasarıma doğru genişleteceğini öngörüyoruz" dedi. “EvoDiff ile aslında yapıya ihtiyaç duymayabileceğimizi, bunun yerine yeni proteinleri kontrollü bir şekilde tasarlamak için ‘ihtiyacınız olan tek şeyin protein dizisi’ olduğunu gösteriyoruz."

EvoDiff çerçevesinin temelinde, tüm farklı türlerden ve proteinlerin işlevsel sınıflarından elde edilen veriler üzerinde eğitilmiş 640 milyon parametreli bir model yer alıyor. (“Parametreler" bir yapay zekâ modelinin eğitim verilerinden öğrenilen parçalarıdır ve esasen modelin bir problem üzerindeki becerisini tanımlar – bu durumda protein üretmek). Modeli eğitmek için kullanılan veriler, dizi hizalamaları için OpenFold veri setinden ve UniProt konsorsiyumu tarafından tutulan protein dizisi ve fonksiyonel bilgi veritabanı UniProt‘tan alınan verilerin bir alt kümesi olan UniRef50‘den elde edilmiştir.

EvoDiff, mimaride Stable Diffusion ve DALL-E 2 gibi birçok modern görüntü üreten modele benzer bir difüzyon modelidir. EvoDiff, neredeyse tamamen gürültüden oluşan bir başlangıç proteininden gürültüyü kademeli olarak nasıl çıkaracağını öğrenir ve onu bir protein dizisine – yavaşça, adım adım – yaklaştırır.

Difüzyon modelleri, EvoDiff gibi yeni proteinler için tasarımlar oluşturmaktan müzik yaratmaya ve hatta konuşmayı sentezlemeye kadar görüntü üretimi dışındaki alanlara giderek daha fazla uygulanmaktadır.

EvoDiff‘in bir diğer ortak katılımcısı olan Microsoft kıdemli araştırmacısı Ava Amini e-posta yoluyla yaptığı açıklamada, “EvoDiff’ten çıkarılacak bir şey varsa, o da elde edebildiğimiz genellik, ölçek ve modülerlik nedeniyle dizi üzerinden protein üretimi yapabileceğimiz ve yapmamız gerektiği fikridir" dedi. “Difüzyon çerçevemiz bize bunu yapma ve ayrıca bu proteinleri belirli işlevsel hedefleri karşılayacak şekilde nasıl tasarlayacağımızı kontrol etme yeteneği veriyor."

Amini‘nin belirttiği gibi, EvoDiff sadece yeni proteinler yaratmakla kalmıyor, aynı zamanda mevcut bir protein tasarımındaki “boşlukları" da doldurabiliyor. Örneğin, bir proteinin başka bir proteine bağlanan bir parçası sağlandığında, model bu parçanın etrafında bir dizi kriteri karşılayan bir protein amino asit dizisi oluşturabilir.

EvoDiff, proteinlerin yapısından ziyade “dizi uzayında" proteinler tasarladığından, nihai üç boyutlu bir yapıya katlanmayan “düzensiz proteinleri" de sentezleyebilir. Normal işleyen proteinler gibi, düzensiz proteinler de biyoloji ve hastalıkta diğer protein aktivitesini arttırmak veya azaltmak gibi önemli roller oynar.

EvoDiff‘in arkasındaki araştırmanın hakem değerlendirmesinden geçmediğini de belirtmek gerekir – en azından henüz. Microsoft‘ta projeye katkıda bulunan bir veri bilimci olan Sarah Alamdari, çerçevenin ticari olarak kullanılabilmesi için daha yapılması gereken “çok fazla ölçeklendirme çalışması" olduğunu kabul ediyor.

Alamdari e-posta yoluyla yaptığı açıklamada, “Bu sadece 640 milyon parametreli bir model ve milyarlarca parametreye kadar ölçeklendirirsek üretim kalitesinin arttığını görebiliriz" dedi. “Bazı kaba taneli stratejiler göstermiş olsak da, daha da ince taneli kontrol elde etmek için, EvoDiff’i metin, kimyasal bilgi veya istenen işlevi belirtmenin diğer yolları üzerine koşullandırmak isteriz."

Bir sonraki adım olarak EvoDiff ekibi, modelin ürettiği proteinleri laboratuvarda test ederek uygulanabilir olup olmadıklarını belirlemeyi planlıyor. Uygun oldukları ortaya çıkarsa, çerçevenin yeni nesli üzerinde çalışmaya başlayacaklar.

Bu içeriği beğendiyseniz lütfen çevrenizle paylaşınız…
Etiketler: , ,