INTRODUCTION: Neurofibromatosis type 1 (NF1) is a common yet complex neurogenetic disorder characterized by a highly variable clinical presentation, influenced by both genetic and environmental factors. While its genetic basis is well understood, the variability in symptoms among patients presents significant challenges for diagnosis and management. This study focuses on examining the differences in clinical features between sporadic and familial NF1 cases. Additionally, it evaluates the potential of machine learning techniques to predict sporadic NF1 cases based on clinical symptoms, offering insights into how computational approaches can complement traditional diagnostic methods.
METHODS: A retrospective analysis was conducted on the medical records of 241 NF1 patients, including 121 sporadic and 120 familial cases. The frequency of various clinical features, such as Lisch nodules, pseudoarthrosis, and hypertension, was compared between the groups. analysis of variance (ANOVA) was used to identify the most important features distinguishing sporadic cases from familial ones. Furthermore, multiple machine learning algorithms, including k-nearest neighbors, artificial neural networks, support vector machines, decision trees, and XGBoost, were employed to predict sporadic cases based on the identified features.
RESULTS: Among the machine learning models tested, the XGBoost algorithm demonstrated the highest predictive accuracy at 62.86%, indicating moderate reliability in identifying sporadic cases. Despite this limitation, the analysis revealed significant differences in clinical manifestations between the two groups. These differences suggest that shared genetic modifiers may play a critical role in shaping the observed genotype-phenotype relationship in NF1.
DISCUSSION AND CONCLUSION: This study represents the first detailed comparison of a broad spectrum of clinical symptoms between sporadic and familial NF1 cases. While machine learning models showed only moderate success in prediction, the findings provide valuable insights into the phenotypic variability of NF1 and underscore the importance of larger, more diverse datasets for improving predictive accuracy. These results hold significant potential for guiding personalized diagnostic and therapeutic strategies for NF1 patients.
GİRİŞ ve AMAÇ: Nörofibromatozis tip 1 (NF1), hem genetik hem de çevresel faktörlerden etkilenen, oldukça değişken bir klinik sunumla karakterize, yaygın ancak karmaşık bir nörogenetik bozukluktur. Genetik temeli iyi anlaşılmış olsa da, hastalar arasındaki semptomların değişkenliği tanı ve yönetim için önemli zorluklar ortaya koymaktadır. Bu çalışma, sporadik ve ailesel NF1 vakaları arasındaki klinik özelliklerdeki farklılıkları incelemeyi amaçlamıştır. Ayrıca, makine öğrenimi tekniklerinin klinik semptomlara dayalı olarak sporadik NF1 vakalarını tahmin etme potansiyelini değerlendirerek, hesaplamalı yaklaşımların geleneksel tanı yöntemlerini nasıl tamamlayabileceğine dair içgörüler sunulmuştur.
YÖNTEM ve GEREÇLER: 121 sporadik ve 120 ailesel vaka dahil olmak üzere 241 NF1 hastasının tıbbi kayıtları üzerinde retrospektif bir analiz yapılmıştır. Lisch nodülleri, psödoartroz ve hipertansiyon gibi çeşitli klinik özelliklerin sıklığı gruplar arasında karşılaştırılmıştır. Sporadik vakaları ailesel olanlardan ayıran en önemli özellikleri belirlemek için varyans analizi (ANOVA) kullanılmıştır. Ayrıca, belirlenen özelliklere dayanarak sporadik vakaları tahmin etmek için k-en yakın komşular, yapay sinir ağları, destek vektör makineleri, karar ağaçları ve XGBoost dahil olmak üzere çoklu makine öğrenimi algoritmaları kullanılmıştır.
BULGULAR: Test edilen makine öğrenimi modelleri arasında XGBoost algoritması %62,86 ile en yüksek tahmin doğruluğunu göstermiş ve sporadik vakaların belirlenmesinde orta düzeyde güvenilirliğe işaret etmiştir. Bu sınırlamaya rağmen, analiz iki grup arasında klinik belirtiler açısından önemli farklılıklar olduğunu ortaya koymuştur. Bu farklılıklar, paylaşılan genetik değiştiricilerin NF1’de gözlenen genotip-fenotip ilişkisini şekillendirmede kritik bir rol oynayabileceğini düşündürmektedir.
TARTIŞMA ve SONUÇ: Bu çalışma, sporadik ve ailesel NF1 vakaları arasında geniş bir klinik semptom spektrumunun ilk ayrıntılı karşılaştırmasını temsil etmektedir. Makine öğrenimi modelleri tahminde yalnızca orta düzeyde başarı gösterirken, bulgular NF1’in fenotipik değişkenliği hakkında değerli bilgiler sağlamakta ve tahmin doğruluğunu artırmak için daha büyük, daha çeşitli veri kümelerinin öneminin altını çizmektedir. Bu sonuçlar, NF1 hastaları için kişiselleştirilmiş tanı ve tedavi stratejilerine rehberlik etme konusunda önemli bir potansiyele sahiptir.