Aller sur ActuaLitte.com

Accueil de la bibliothèque > Modélisation prédictive et apprentissage statistique avec R

Livre numérique

Modélisation prédictive et apprentissage statistique avec R

illustration du livre Modélisation prédictive et apprentissage statistique avec R

Résumé

Issu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation de statistique et de machine learning, à travers le fil conducteur d’une étude de cas. Chaque méthode fait l’objet d’un rappel de cours et est accompagnée de références bibliographiques, puis est mise en oeuvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu’aux astuces de programmation permettant d’optimiser les temps de calcul. À ce sujet, une annexe est consacrée au traitement des données massives.


L’ouvrage commence par les méthodes de classement classiques les plus éprouvées, mais aborde rapidement les méthodes plus récentes et avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge. Chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu’ils illustrent bien les principes sous-jacents à ces méthodes. Mais l’aspect pratique est aussi privilégié, avec l’objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L’exploration et la préparation préliminaire des données sont d’ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse
finale est faite de toutes les méthodes présentées.
La mise en oeuvre s’appuie sur le logiciel libre R et sur un jeu public de données. Ce dernier peut être téléchargé sur internet et présente l’intérêt d’être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il a servi. Le logiciel statistique utilisé est R, actuellement celui qui se développe le plus : devenu la lingua franca de la statistique et l’outil le plus répandu dans le monde académique, il prend également de plus en plus de place dans le monde de l’entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec
R. Outre qu’il est disponible pour tous, dans de multiples environnements, il est aussi le plus riche statistiquement et c’est le seul logiciel permettant de mettre en oeuvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul athématique permet de se concentrer dans le codage sur les aspects statistiques. R permet d’arriver directement à l’essentiel et de mieux comprendre les méthodes exposées dans l’ouvrage.

 

Le Code R utilisé dans l’ouvrage est disponible sur cette page dans la partie "Bonus/lire".


Table des matières :

Présentation du jeu de données. Préparation des données. Exploration des données. Discrétisation automatique supervisée des variables continues. La régression logistique. La régression logistique pénalisée ridge. La régression logistique pénalisée lasso. La régression logistique PLS. L’arbre de décision CART. L’algorithme PRIM. Les forêts aléatoires. Le bagging. Les forêts aléatoires de modèles logistiques. Le boosting. Les Support Vector Machines. Les réseaux de neurones. Synthèse des méthodes prédictives. Annexes. Bibliographie. Index des packages R utilisés.

 

Auteur TUFFERY Stéphane
Date de publication 2015-01-02
Domaine public nc
Editeur Editions TECHNIP
ISBN 10 2710811588
ISBN 13 9782710811589
Nombre de pages 432
Dimensions largeur 17.00 cm
Dimensions Hauteur 24.00 cm
Dimensions épaisseur 2.50 cm
Télécharger en EPUB n/a
Télécharger en PDF Télécharger le livre numérique

 

ActuaLité

Yann Moix se prépare à intégrer l'émission On n'est pas couché
En remplacement du clivant Aymeric Caron, Yann Moix fera son entrée dans l'émission « On n'est pas couché », sur France 2, à partir de la prochaine rentrée. Interrogé par RTL, l'écrivain a assuré se préparer consciencieusement à cette nouvelle aventure, rapporte Gala.   Mais, au...

Quand l'écrivain Sylvain Tesson interroge Gérard Depardieu
L'écrivain Sylvain Tesson est allé à la rencontre de l'acteur Gérard Depardieu, dans sa maison parisienne du sixième arrondissement. L'entretien, réalisé pour le magazine Vanity Fair, donne à voir un acteur bien mélancolique, rapporte Le Point.   A l'affiche du film Valley of Love,...

Le Royaume-Uni agité : éditeurs et marchands s'empoignent en silence
La presse savoure déjà, et à tort, le conflit annoncé entre Penguin Random House et Amazon. Un passionnant épisode estival qui s'approche, pour remplir les longues journées des juilletistes et aoûtiens. Bien entendu, la dispute n'intervient, pour l'instant, que sur le territoire britannique,...

Laurence Peyrin reçoit le Prix Maison de la Presse 2015
Un jury de 20 professionnels du livre et de la distribution présidé par Katherine Pancol a remis le 20 mai dernier le Prix Maison de la Presse à Laurence Peyrin pour son deuxième roman, La drôle de vie de Zelda Zonk, publié chez Kero. Une cérémonie organisée au Centre National du Livre,...

Les gentlemen extraordinaires d'Alan Moore, de nouveau au cinéma
Le comics d'Alan Moore et de Kevin O'Neill, La Ligue des gentlemen extraordinaires, va de nouveau être adapté pour le cinéma, par Century Fox. L'œuvre met en scène plusieurs personnages de la littérature du XIXe siècle, comme le Dr Jekyll et son alter ego maléfique, M. Hyde (Robert Louis...

 

Bienvenue dans la nouvelle bibliothèque de livres numériques de ActuaLitté, en partenariat avec Google Livres.
Ce livre écrit par TUFFERY Stéphane.
Le livre s'appelle Modélisation prédictive et apprentissage statistique avec R et a été publié en 2015-01-02.
Vous pouvez également retrouver des milliers d'autres livres numériques dans la bibliothèque numérique de ActuaLitté.

Suivez-nous

Désinscription

Sondage

Les auteurs sont en difficulté : pour les aider...

 

 

 

 

 

 

 

 

 

 

© 2020 - actualitté.com