Contexte
Le gène CHD2 est l’un des gènes les plus fréquemment impliqués dans l’encéphalopathie développementale et épileptique (DEE). Avec l’avènement du séquençage à haut débit, l’identification des variants de CHD2 a augmenté, nécessitant une évaluation des performances spécifiques au gène des outils largement utilisés, car les références à l’échelle du génome peuvent masquer une telle hétérogénéité.
Méthodes
Le jeu de données des variants pathogènes et de contrôle de CHD2 a été sélectionné à partir des bases de données ClinVar, HGMD et PubMed. Les outils inclus étaient SIFT, SIFT4G, Polyphen2_HDIV, Polyphen2_HVAR, MutationAssessor, PROVEAN, MetaSVM, MetaLR, MetaRNN, M-CAP, MutPred2, PrimateAI, DEOGEN2, BayesDel_addAF, BayesDel_noAF, ClinPred, LIST-S2, ESM1b, AlphaMissense et fathmm-XF_coding. Les outils in silico ont été évalués en fonction de l’exactitude, de la sensibilité, de la spécificité, de la valeur prédictive positive (PPV), de la valeur prédictive négative (NPV), du coefficient de corrélation de Matthews (MCC), du F-score et de la surface sous la courbe ROC (AUC).
Résultats
Un total de 27 variants faux-sens classés comme pathogènes ou probablement pathogènes ont été utilisés comme ensemble positif, et 57 variants faux-sens ont été utilisés comme ensemble négatif. Les meilleurs outils en termes d’exactitude sont MutPred2, ESM1b, AlphaMissense et PROVEAN. En termes de MCC et de F-score, un degré plus élevé a été observé dans MutPred2 et AlphaMissense (score MCC > 0,8). ClinPred, AlphaMissense et BayesDel_addAF avaient un score AUC plus élevé (AUC > 0,99). Les scores SIFT, SIFT4G, Polyphen2_HDIV, Polyphen2_HVAR, ClinPred et AlphaMissense ont montré une distribution bimodale distincte, tandis que les scores d’autres prédicteurs ont montré une gamme de distribution plus large.
Conclusion
Notre étude met en évidence la variation significative des performances des différents outils in silico pour prédire la pathogénicité des variants faux-sens de CHD2. Compte tenu de ses performances globales, MutPred2 et AlphaMissense peuvent être le choix préféré pour l’application clinique dans la DEE associée à CHD2, fournissant une référence possible pour optimiser le diagnostic génétique et la classification des variants faux-sens de CHD2.
Importance du gène CHD2
L’encéphalopathie développementale et épileptique (DEE) représente un groupe hétérogène de troubles épileptiques à début précoce caractérisés par des crises réfractaires, accompagnées d’un déclin cognitif ou d’une régression associée à une activité épileptique continue. Cette condition débilitante a un impact significatif sur la qualité de vie des patients et de leurs familles, nécessitant des stratégies diagnostiques et thérapeutiques robustes. Ces dernières années, des avancées significatives ont été réalisées dans la compréhension des bases génétiques de la DEE, avec l’identification de divers gènes causatifs, y compris CHD2.
Le gène CHD2, situé sur le chromosome 15q26, code pour la protéine de liaison à l’ADN hélicase chromodomaine 2, qui est abondamment exprimée dans le cerveau, en particulier dans le néocortex, l’hippocampe, le cervelet et le bulbe olfactif. En tant que remodelleurs de la chromatine, les protéines CHD2 jouent un rôle crucial dans la régulation des gènes et le développement neuronal. Les mutations du gène CHD2 ont été impliquées dans une gamme de troubles neurodéveloppementaux, y compris la DEE, le trouble du spectre autistique (TSA), le handicap intellectuel (HI) et le trouble déficitaire de l’attention avec hyperactivité (TDAH).
Défis et outils bioinformatiques
Avec l’avènement des technologies de séquençage à haut débit, le dépistage des variants chez les patients atteints de DEE a conduit à la découverte de nombreux variants de CHD2, dont beaucoup sont des variants faux-sens. Cependant, déterminer la pathogénicité de ces variants reste un défi majeur en raison de la nature chronophage et coûteuse des évaluations fonctionnelles. Dans ce contexte, les outils bioinformatiques sont devenus des ressources indispensables pour prédire la signification fonctionnelle des variants. Ces outils exploitent diverses méthodologies, telles que la conservation des séquences, l’analyse des propriétés des acides aminés et la modélisation structurelle, pour classer les variants en catégories telles que « pathogène/délétère » ou « bénin/tolérant ».
Malgré la prolifération des outils in silico, leurs performances dans la prédiction de la pathogénicité des variants faux-sens de CHD2 varient largement. Plusieurs études ont évalué l’exactitude, la sensibilité et la spécificité de ces outils, avec des résultats incohérents. Par conséquent, il est urgent de procéder à une évaluation complète des performances de ces outils spécifiquement pour les variants faux-sens de CHD2 afin de guider la prise de décision clinique et d’améliorer les résultats pour les patients.
Évaluation des outils in silico
Dans cette étude, nous avons évalué les performances de prédiction de 20 outils in silico pour les variants faux-sens de CHD2. En collectant un jeu de données de variants pathogènes et de contrôle, nous avons évalué l’exactitude, la sensibilité, la spécificité, la valeur prédictive positive (PPV), la valeur prédictive négative (NPV), le coefficient de corrélation de Matthews (MCC), le F-score et la surface sous la courbe ROC (AUC) de chaque outil. Nos résultats révèlent des différences significatives dans les performances de ces outils à plusieurs égards, avec MutPred2 et AlphaMissense peut-être les premiers outils de ligne dans l’ensemble. Cette étude fournit des informations précieuses sur les forces et les limites de divers outils in silico, facilitant des prédictions plus informées et précises de la pathogénicité des variants faux-sens de CHD2. De plus, nos résultats fournissent des indices pour l’interprétation clinique des gènes, soulignant le potentiel des outils in silico pour améliorer le diagnostic et la gestion de la DEE et des troubles neurodéveloppementaux connexes.
Conclusion
En conclusion, l’étude fournit des informations précieuses sur les performances de divers outils in silico pour prédire la pathogénicité des variants faux-sens de CHD2. En identifiant MutPred2 et AlphaMissense comme prédicteurs de première ligne, l’étude a démontré le potentiel des méthodes bioinformatiques avancées pour améliorer l’exactitude et la fiabilité des évaluations de la pathogénicité des variants. Cependant, il est important de reconnaître les limites de ces outils et de valider leurs prédictions à l’aide de méthodes expérimentales. À l’avenir, nous attendons avec impatience le développement et le raffinement continus des outils in silico pour mieux répondre aux besoins de la communauté clinique et améliorer les soins et les résultats des patients.
🔗 **Fuente:** https://www.frontiersin.org/journals/neurology/articles/10.3389/fneur.2025.1729387/full