DeepH-DTA: Deep Learning for Predicting Drug-Target Interactions: A Case Study of COVID-19 Drug Repurposing
pmid: 34786289
pmc: PMC8545313
DeepH-DTA: Deep Learning for Predicting Drug-Target Interactions: A Case Study of COVID-19 Drug Repurposing
La propagation rapide de la nouvelle pneumonie à coronavirus (COVID-19) a entraîné une augmentation spectaculaire du taux de mortalité dans le monde. Malgré de nombreux efforts, le développement rapide d'un vaccin efficace contre ce nouveau virus prendra beaucoup de temps et repose sur l'identification des interactions médicament-cible (DT) à l'aide de médicaments disponibles dans le commerce pour identifier les inhibiteurs potentiels. Motivés par cela, nous proposons un nouveau cadre, appelé DeepH-DTA, pour prédire les affinités de liaison à la DT pour les médicaments hétérogènes. Nous proposons un modèle d'attention graphique hétérogène (HGAT) pour apprendre les informations topologiques des molécules composées et des couches bidirectionnelles ConvLSTM pour modéliser les informations spatio-séquentielles dans les séquences simplifiées du système d'entrée de ligne d'entrée moléculaire (SMILES) des données sur les médicaments. Pour les séquences de protéines, nous proposons un réseau convolutif dense à excitation comprimée pour apprendre les représentations cachées dans les séquences d'acides aminés ; tout en utilisant des techniques d'intégration avancées pour coder les deux types de séquences d'entrée. La performance de DeepH-DTA est évaluée par le biais d'expériences approfondies contre des approches de pointe utilisant deux ensembles de données publics (Davis et KIBA) qui comprennent des échantillons éclectiques de la famille des protéines kinases et des inhibiteurs pertinents. DeepH-DTA atteint l'indice de concordance (IC) le plus élevé de 0,924 et 0,927 et a également atteint une erreur quadratique moyenne (MSE) de 0,195 et 0,111 sur les ensembles de données Davis et KIBA respectivement. De plus, une étude utilisant des médicaments approuvés par la FDA à partir de la base de données de la Drug Bank est réalisée à l'aide de DeepH-DTA pour prédire les scores d'affinité des médicaments contre les séquences d'acides aminés du SARS-CoV-2, et les résultats montrent que le modèle peut prédire certains des inhibiteurs du SARS-Cov-2 récemment approuvés dans de nombreuses études cliniques.
La rápida propagación de la nueva neumonía por coronavirus (COVID-19) ha provocado un aumento drástico de la tasa de mortalidad en todo el mundo. A pesar de muchos esfuerzos, el rápido desarrollo de una vacuna eficaz para este nuevo virus llevará un tiempo considerable y se basa en la identificación de interacciones fármaco-diana (DT) utilizando medicamentos disponibles comercialmente para identificar posibles inhibidores. Motivados por esto, proponemos un nuevo marco, llamado DeepH-DTA, para predecir las afinidades de unión de DT para fármacos heterogéneos. Proponemos un modelo de atención gráfica heterogénea (HGAT) para aprender información topológica de moléculas compuestas y capas ConvLSTM bidireccionales para modelar información espacio-secuencial en secuencias simplificadas del sistema de entrada de línea de entrada molecular (SMILES) de datos de fármacos. Para las secuencias de proteínas, proponemos una red convolucional densa exprimida-excitada para aprender representaciones ocultas dentro de las secuencias de aminoácidos; mientras se utilizan técnicas avanzadas de incrustación para codificar ambos tipos de secuencias de entrada. El rendimiento de DeepH-DTA se evalúa a través de extensos experimentos contra enfoques de vanguardia que utilizan dos conjuntos de datos públicos (Davis y KIBA) que comprenden muestras eclécticas de la familia de proteínas quinasas y los inhibidores pertinentes. DeepH-DTA alcanza el índice de concordancia (IC) más alto de 0,924 y 0,927 y también logró un error cuadrático medio (MSE) de 0,195 y 0,111 en los conjuntos de datos de Davis y KIBA, respectivamente. Además, se realiza un estudio utilizando fármacos aprobados por la FDA de la base de datos del Banco de Fármacos utilizando DeepH-DTA para predecir las puntuaciones de afinidad de los fármacos contra las secuencias de aminoácidos del SARS-CoV-2, y los resultados muestran que el modelo puede predecir algunos de los inhibidores del SARS-Cov-2 que se han aprobado recientemente en muchos estudios clínicos.
The rapid spread of novel coronavirus pneumonia (COVID-19) has led to a dramatically increased mortality rate worldwide. Despite many efforts, the rapid development of an effective vaccine for this novel virus will take considerable time and relies on the identification of drug-target (DT) interactions utilizing commercially available medication to identify potential inhibitors. Motivated by this, we propose a new framework, called DeepH-DTA, for predicting DT binding affinities for heterogeneous drugs. We propose a heterogeneous graph attention (HGAT) model to learn topological information of compound molecules and bidirectional ConvLSTM layers for modeling spatio-sequential information in simplified molecular-input line-entry system (SMILES) sequences of drug data. For protein sequences, we propose a squeezed-excited dense convolutional network for learning hidden representations within amino acid sequences; while utilizing advanced embedding techniques for encoding both kinds of input sequences. The performance of DeepH-DTA is evaluated through extensive experiments against cutting-edge approaches utilising two public datasets (Davis, and KIBA) which comprise eclectic samples of the kinase protein family and the pertinent inhibitors. DeepH-DTA attains the highest Concordance Index (CI) of 0.924 and 0.927 and also achieved a mean square error (MSE) of 0.195 and 0.111 on the Davis and KIBA datasets respectively. Moreover, a study using FDA-approved drugs from the Drug Bank database is performed using DeepH-DTA to predict the affinity scores of drugs against SARS-CoV-2 amino acid sequences, and the results show that that the model can predict some of the SARS-Cov-2 inhibitors that have been recently approved in many clinical studies.
أدى الانتشار السريع للالتهاب الرئوي بفيروس كورونا المستجد (COVID -19) إلى زيادة كبيرة في معدل الوفيات في جميع أنحاء العالم. على الرغم من العديد من الجهود، فإن التطوير السريع للقاح فعال لهذا الفيروس الجديد سيستغرق وقتًا طويلاً ويعتمد على تحديد تفاعلات الدواء المستهدف (DT) باستخدام الأدوية المتاحة تجاريًا لتحديد المثبطات المحتملة. بدافع من هذا، نقترح إطارًا جديدًا، يسمى DeepH - DTA، للتنبؤ بالانتماءات الملزمة لـ DT للأدوية غير المتجانسة. نقترح نموذجًا غير متجانس لانتباه الرسم البياني (HGAT) لتعلم المعلومات الطوبولوجية للجزيئات المركبة وطبقات ConvLSTM ثنائية الاتجاه لنمذجة المعلومات المكانية التسلسلية في تسلسل نظام إدخال خط الإدخال الجزيئي المبسط (SMILES) لبيانات الدواء. بالنسبة لتسلسلات البروتين، نقترح شبكة التفافية كثيفة متحمسة لتعلم التمثيلات الخفية داخل تسلسلات الأحماض الأمينية ؛ مع استخدام تقنيات التضمين المتقدمة لترميز كلا النوعين من تسلسلات المدخلات. يتم تقييم أداء DeepH - DTA من خلال تجارب مكثفة ضد الأساليب المتطورة باستخدام مجموعتي بيانات عامتين (ديفيس، وكيبا) والتي تتكون من عينات انتقائية من عائلة بروتين الكيناز والمثبطات ذات الصلة. حققت DeepH - DTA أعلى مؤشر توافق (CI) قدره 0.924 و 0.927 وحققت أيضًا متوسط خطأ مربع (MSE) قدره 0.195 و 0.111 في مجموعات بيانات Davis و KIBA على التوالي. علاوة على ذلك، يتم إجراء دراسة باستخدام الأدوية المعتمدة من إدارة الأغذية والعقاقير من قاعدة بيانات بنك الأدوية باستخدام DeepH - DTA للتنبؤ بعشرات التقارب من الأدوية ضد متواليات الأحماض الأمينية لفيروس كورونا 2 المرتبط بمتلازمة الجهاز التنفسي الحادة الوخيمة، وتظهر النتائج أن النموذج يمكن أن يتنبأ ببعض مثبطات فيروس كورونا 2 المرتبط بمتلازمة الجهاز التنفسي الحادة الوخيمة التي تمت الموافقة عليها مؤخرًا في العديد من الدراسات السريرية.
- American University in the Emirates United Arab Emirates
- Zagazig University Egypt
- Mansoura University Egypt
- UNSW Canberra Australia
- UNSW Sydney Australia
Artificial intelligence, Drug Target Identification, General Computer Science, Infectious disease (medical specialty), Prediction of Peptide-MHC Binding Affinity, Computational biology, Identification (biology), Biochemistry, Genetics and Molecular Biology, Machine learning, Pathology, General Materials Science, drug-target interaction, Disease, Molecular Biology, Biology, Pharmacology, Prediction of Protein Subcellular Localization, SARS-CoV-2, Drug repositioning, General Engineering, Botany, Life Sciences, Deep learning, Computer science, TK1-9971, Coronavirus disease 2019 (COVID-19), Computational Theory and Mathematics, Computer Science, Physical Sciences, Medicine, Computational and Artificial Intelligence, Electrical engineering. Electronics. Nuclear engineering, Drug, Computational Methods in Drug Discovery
Artificial intelligence, Drug Target Identification, General Computer Science, Infectious disease (medical specialty), Prediction of Peptide-MHC Binding Affinity, Computational biology, Identification (biology), Biochemistry, Genetics and Molecular Biology, Machine learning, Pathology, General Materials Science, drug-target interaction, Disease, Molecular Biology, Biology, Pharmacology, Prediction of Protein Subcellular Localization, SARS-CoV-2, Drug repositioning, General Engineering, Botany, Life Sciences, Deep learning, Computer science, TK1-9971, Coronavirus disease 2019 (COVID-19), Computational Theory and Mathematics, Computer Science, Physical Sciences, Medicine, Computational and Artificial Intelligence, Electrical engineering. Electronics. Nuclear engineering, Drug, Computational Methods in Drug Discovery
citations This is an alternative to the "Influence" indicator, which also reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).38 popularity This indicator reflects the "current" impact/attention (the "hype") of an article in the research community at large, based on the underlying citation network.Top 10% influence This indicator reflects the overall/total impact of an article in the research community at large, based on the underlying citation network (diachronically).Top 10% impulse This indicator reflects the initial momentum of an article directly after its publication, based on the underlying citation network.Top 10%
