حوالي 10 سنوات قبل ذلك، كان Žiga Avsec طالب دكتوراه في الفيزياء، ووجد نفسه يتلقى دورة تدريبية مكثفة في علم الجينوم عبر وحدة جامعية حول التعلم الآلي. وسرعان ما كان يعمل في مختبر يدرس الأمراض النادرة، في مشروع يهدف إلى تحديد الطفرة الجينية الدقيقة التي تسببت في مرض غير عادي في الميتوكوندريا.
وكانت هذه، كما تقول شركة Avsec، بمثابة مشكلة “إبرة في كومة قش”. كان هناك ملايين من المسببات المحتملة الكامنة في الشفرة الوراثية، وهي طفرات الحمض النووي التي يمكن أن تعيث فسادًا في بيولوجيا الشخص. كان ما يسمى بالمتغيرات الخاطئة موضع اهتمام خاص: تغييرات حرف واحد في الشفرة الوراثية تؤدي إلى تصنيع حمض أميني مختلف داخل البروتين. الأحماض الأمينية هي اللبنات الأساسية للبروتينات، والبروتينات هي اللبنات الأساسية لكل شيء آخر في الجسم، لذلك حتى التغييرات الصغيرة يمكن أن يكون لها تأثيرات كبيرة وبعيدة المدى.
هناك 71 مليون متغير خاطئ محتمل في الجينوم البشري، ويحمل الشخص العادي أكثر من 9000 منها. معظمها غير ضار، لكن بعضها متورط في أمراض وراثية مثل فقر الدم المنجلي والتليف الكيسي، بالإضافة إلى حالات أكثر تعقيدًا مثل مرض السكري من النوع الثاني، والذي قد يكون ناجمًا عن مجموعة من التغيرات الجينية الصغيرة. بدأ Avsec بسؤال زملائه: “كيف نعرف أيها خطير بالفعل؟” الجواب: “حسناً، إلى حد كبير، نحن لا نفعل ذلك”.
ومن بين 4 ملايين متغير خاطئ تم رصدها في البشر، تم تصنيف 2% فقط على أنها إما مسببة للأمراض أو حميدة، وذلك من خلال سنوات من الأبحاث المضنية والمكلفة. قد يستغرق الأمر شهورًا لدراسة تأثير متغير واحد خاطئ.
اليوم، أصدرت شركة Google DeepMind، حيث تعمل شركة Avsec الآن كعالمة أبحاث، أداة يمكنها تسريع هذه العملية بسرعة. AlphaMissense هو نموذج للتعلم الآلي يمكنه تحليل المتغيرات الخاطئة والتنبؤ باحتمال تسببها في مرض بدقة تصل إلى 90 بالمائة، وهو أفضل من الأدوات الموجودة.
إنه مبني على نموذج AlphaFold، وهو نموذج DeepMind الرائد الذي تنبأ ببنية مئات الملايين من البروتينات من خلال تركيب الأحماض الأمينية، لكنه لا يعمل بنفس الطريقة. بدلًا من إجراء تنبؤات حول بنية البروتين، يعمل AlphaMissense بشكل أشبه بنموذج لغة كبير مثل ChatGPT الخاص بشركة OpenAI.
لقد تم تدريبه على لغة علم الأحياء البشري (والرئيسيات)، لذا فهو يعرف كيف يجب أن يبدو التسلسل الطبيعي للأحماض الأمينية في البروتينات. عندما يتم تقديمه بتسلسل خاطئ، يمكنه ملاحظة ذلك، كما هو الحال مع كلمة غير متطابقة في الجملة. يقول جون تشينج، الذي يعمل مع شركة Avsec، المؤلف الرئيسي المشارك لورقة بحثية نُشرت اليوم في مجلة “إنه نموذج لغوي ولكنه مدرب على تسلسلات البروتين”. علوم التي تعلن عن AlphaMissense للعالم. “إذا استبدلنا كلمة من جملة إنجليزية، فيمكن لأي شخص على دراية باللغة الإنجليزية أن يرى على الفور ما إذا كانت هذه البدائل ستغير معنى الجملة أم لا.”
ويستخدم بوشميت كوهلي، نائب رئيس الأبحاث في شركة DeepMind، تشبيه كتاب الوصفات. إذا كان AlphaFold مهتمًا بكيفية ارتباط المكونات معًا، فإن AlphaMissense يتنبأ بما قد يحدث إذا استخدمت المكون الخاطئ تمامًا.