Skip to content
View soboure69's full-sized avatar
🎓
Etudie
🎓
Etudie

Block or report soboure69

Block user

Prevent this user from interacting with your repositories and sending you notifications. Learn more about blocking users.

You must be logged in to block users.

Maximum 250 characters. Please don't include any personal information such as legal names or email addresses. Markdown supported. This note will be visible to only you.
Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Report abuse
soboure69/README.md

IMG-20250627-WA0002

Bienvenue sur mon profil GitHub 👋!

Je suis Soboure BELLO, étudiant en école d'ingénieur à Polytech Lyon, spécialisé en Mathématiques Appliquées et Modélisation. Je suis activement à la recherche d'opportunités (Stage, alternance, job) dans les domaines de la data science, de la statistique, de l'analyse de données et de la modélisation.

Passionné par la data science, le machine learning, l'analyse des données et leur application à des problématiques réelles, je combine une rigueur mathématique, un esprit analytique et de synthèse, ainsi qu'une forte capacité à vulgariser mon travail pour transformer des données brutes en informations exploitables.

Compétences Techniques

Ma formation et mes projets m'ont permis d'acquérir une solide expertise dans les domaines suivants :

  • Langages de Programmation :

    • Maîtrise de Python, R, SQL, et C++.
    • Expérience avec l'algorithmique de base et la programmation orientée objet (C++).
    • Utilisation de Git pour la gestion de versions de code.
  • Data Science & Machine Learning :

    • Mise en œuvre de modèles supervisés et non-supervisés en machine learning.
    • Utilisation des frameworks : TensorFlow, Keras, Scikit-Learn, PyTorch.
    • Notions de parallélisation des calculs et auto-apprentissage en Big Data.
  • Statistiques & Modélisation :

    • Solides connaissances en statistiques et modélisation mathématique.
    • Tests statistiques : Problèmes de test, risques associés, test du rapport de vraisemblance maximale, test de Student, test du Chi2, probabilité de Fisher, V de Cramer, test de Kolmogorov-Smirnov, test de Shapiro-Wilk.
    • Modèles de régression : Linéaire simple et multiple, ANOVA, ANCOVA, régression logistique, modèles mixtes, GLM, PLS, Ridge, non et semi-paramétriques.
    • Simulation aléatoire : Monte-Carlo, rejet, inversion.
    • Statistique inférentielle et Bootstrap (paramétrique, non paramétrique).
    • Séries temporelles : Lissage, désaisonnalisation, prévision, processus univariés (MA, AR, ARMA, ARIMA, SARIMA).
    • Modèles bayésiens : MCMC, inférence bayésienne.
    • Modèles de durée (fiabilité, santé).
  • Analyse de Données & Bases de Données :

    • Analyse et visualisation des données avec Pandas, Matplotlib, Seaborn.
    • Déploiement de tableaux de bord interactifs avec Streamlit, Dash, ou Shiny.
    • Pré-traitement, visualisation, statistiques univariées et multivariées des données.
    • Analyse de données et classification : Analyse en composantes principales (ACP), Analyses factorielles des correspondances (AFC), Analyse des correspondantes multiples (ACM), Méthodes de classification, Analyses discriminantes.
    • Manipulation de bases de données, notions de SQL.
  • Méthodes Numériques & Calcul Scientifique :

    • Analyse numérique (résolution de problèmes linéaires et non linéaires).
    • Méthodes de discrétisation : différences finies, volumes finis, éléments finis.
    • Problèmes instationnaires, lois de conservation.
    • Optimisation continue (sans contrainte, avec contraintes) et Recherche Opérationnelle (programmation linéaire, graphes, métaheuristiques).
    • Calcul Haute Performance (MPI, OpenMP, OpenCL).

Projets Académiques et Personnels

Mes projets me permettent de mettre en pratique mes connaissances et de développer des solutions concrètes :

  • Projet 1: Géolocalisation

    • Construction d'une fonction de géolocalisation à partir des forces de signal de bornes (cartes RSSI).
    • Manipulation et visualisation des cartes RSSI, proposition de méthode pour compléter les données manquantes.
    • Conception, entraînement et évaluation d'un réseau de neurones dense pour la géolocalisation, en utilisant une fonction Loss appropriée et des métriques d'évaluation comme le R2 score.
  • Projet 2: Simulations aléatoires

    • Application de techniques de simulation aléatoire sous R par diverses méthodes : Monte-Carlo, rejet, inversion.
    • Traduction de concepts théoriques en solutions pratiques pour explorer et analyser des phénomènes aléatoires.
  • Projet 3: Prisonniers et Permutations

    • Modélisation d'une situation amusante avec les permutations pour déterminer une stratégie de forte chance de liberté.
    • Compréhension de la situation, choix des éléments à modéliser et traduction du problème avec les permutations circulaires.
    • Résolution à l'aide de théorèmes sur les permutations et les probabilités, puis modélisation et simulation du problème sous Python pour confirmer les résultats théoriques.
  • Projet 4: Analyse Exploratoire de données (en cours)

    • Analyse de transactions bancaires pour identifier des schémas de fraude.
    • Pré-traitement, visualisation, statistiques univariées et multivariées des données.
    • Déploiement d'un tableau de bord interactif : création d'applications de data visualisation avec Streamlit, Dash, ou Shiny.
  • Étude sur les aspects de l'analyse statistique non paramétrique

    • Utilisation du logiciel R et de ses packages pour les tests de Kolmogorov-Smirnov et Shapiro-Wilk.
  • Travail Pratique sur les modèles de régression linéaire

Formation

  • Cycle Ingénieur en Mathématiques Appliquées et Modélisation

    • Polytech Lyon, Lyon (sept. 2023 à 2027).
    • Compétences acquises : analyse de données et statistiques, maîtrise de la programmation (notamment en Python et R), capacités en modélisation et en algorithmie.
  • Licence L2 & L3 en Mathématiques Appliquées

    • Université de Paris Cité, Paris (sept. 2021 à juin 2023).

Qualités Personnelles

  • Rigueur mathématique, esprit analytique et de synthèse.
  • Capacité à travailler en équipe, autonomie et proactivité.
  • Savoir vulgariser mon travail.
  • Curiosité et esprit critique.
  • Intérêt pour l'impact sociétal des données.

Me Contacter

N'hésitez pas à me contacter pour toute opportunité de stage ou discussion professionnelle :


Pinned Loading

  1. Movie-Backend Movie-Backend Public

    Phase 1 du Projet CinéData

    Python

  2. Movies-Analytics Movies-Analytics Public

    Phase 2 du Projet CinéData

    Jupyter Notebook

  3. G-olocalisation-Cartes-RSSI G-olocalisation-Cartes-RSSI Public

    Construction d’une fonction qui à partir des 4 forces de signal des bornes (cartes RSSI) reçues donne la position (géolocalisation)

    Jupyter Notebook

  4. A-B-Testing A-B-Testing Public

    Appliquer l'A/B testing dans le secteur du marketing

    Jupyter Notebook

  5. Analyse_Exploratoire_Donn-es_EDA Analyse_Exploratoire_Donn-es_EDA Public

    Il est question de faire une analyse exploratoire des données en Banque et en Marketing

    Jupyter Notebook

  6. Customer-Churn Customer-Churn Public

    Projet de machine learning visant à prédire le désabonnement des clients d'une entreprise de télécommunications, également appelé "customer churn".

    Jupyter Notebook