|
Creascience vous propose cet automne une série de 3 ateliers d'une journée chacun sur les techniques de régression. Les ateliers auront lieu au centre-ville de Montréal du 16 au 18 octobre prochain. Inscrivez-vous afin de parfaire vos connaissances ou pour apprendre de nouvelles méthodes de modélisation des données. Les participants peuvent s'inscrire à chaque atelier de manière indépendante ou en combinaison.
Atelier 1 : Techniques de régression linéaire simple et multiple
Cette session présente les outils et concepts essentiels à la bonne construction de modèles de régression linéaire. Au-delà de l'interprétation des tables de coefficients, l'accent est mis sur les conditions de construction des modèles, la différence entre les modèles explicatifs et prédictifs, la manière d'évaluer leur qualité notamment avec des outils graphiques, les pièges à éviter et la bonne interprétation des différents indicateurs et tableaux produits par les logiciels. Plusieurs méthodes avancées sont également discutées, notamment les techniques de sélection de variable ("stepwise,"best subset", etc.), l'utilisation de variables explicatives catégoriques, l'inclusion d'effets non linéaires et d'interactions (régression polynomiale) et la gestion des variables explicatives corrélées (multicolinéarité). Tous ces aspects sont abordés à travers une variété d'études de cas.
Atelier 2 : La régression pour données catégoriques
Cette session offre une présentation des techniques de modélisation pour des variables réponses catégoriques avec une emphase sur la régression logistique. Les concepts fondamentaux sont abordés dans le cadre de la modélisation d'une réponse binaire, en commençant avec l'inadéquation de la régression linéaire dans ce cas pour introduire la définition alternative du modèle logistique. Tout en indiquant les similarités avec la régression linéaire, les outils, indicateurs et diagnostics propres à cette approche sont présentés de manière détaillée. Ainsi, cet atelier aborde en particulier les notions de rapports de cote (odds ratios) utilisés pour mesurer l'ampleur des effets, de spécificité, de sensibilité et de courbe ROC et les techniques de de validation croisée. La généralisation à une réponse comportant plus de 2 niveaux ordonnés ou non est discutée tout comme les alternatives à la régression logistique.
Atelier 3 : La régression PLS
Cette session aborde la problématique de la corrélation des variables explicatives dans les modèles de régression (multicollinéarité), son impact sur la qualité des modèles obtenus dans ce contexte et présente la technique actuellement la plus populaire pour la résoudre, la régression Partial Least Squares (PLS). Le séminaire aborde le principe de la régression PLS à travers son lien avec les méthodes statistiques multivariées, notamment l'analyse en composantes principales (ACP). L'emphase est également mise sur les stratégies permettant la mesure de la capacité de prédiction des modèles et leur application pour optimiser la construction d'un modèle PLS. Différentes études de cas et analyses sont réalisées et discutées. Celles-ci visent autant à familiariser les participants avec les résultats fournis par différents logiciels qu'à les sensibiliser aux conditions d'utilisation de la régression PLS et à éviter certaines erreurs.
Pour profiter pleinement de cette formation, les participants sont invités à utiliser leur propre logiciel statistique et leurs jeux données.
Informations supplémentaires et inscription en ligne.
|