Détection des Maladies Cardiaques
Ce projet consiste à analyser et prédire la présence de maladies cardiaques à partir d'un jeu de données médicales en utilisant différentes méthodes d'apprentissage automatique.
Objectifs
Comprendre et explorer le dataset Heart Disease Detection.
Prétraiter les données et gérer les valeurs manquantes.
Encoder les variables catégorielles et analyser les corrélations.
Comparer plusieurs modèles de classification pour identifier le meilleur :
Gaussian Naive Bayes
KNN (K=3)
Decision Tree (max_depth=6)
SVM implémenté from scratch
Évaluer les modèles avec matrices de confusion, rapports de classification, courbes ROC et validation croisée.
Faire des prédictions sur des échantillons test.
Technologies
Python
Pandas, NumPy
Scikit-learn
Matplotlib, Seaborn
Jupyter Notebook
Résultats
Analyse exploratoire du dataset et visualisation des distributions.
Identification du modèle le plus performant selon les métriques choisies.
Visualisation des courbes ROC et performance comparative des modèles.