Significant Info et Pipelines de Machine Learning : Analyser et modéliser vos données avec Apache Sparklyr

Ce livre est disponible sur Amazon : https://www.amazon.fr/gp/solution/B0BDWHZVJG/ref=dbs_a_def_rwt_hsch_vapi_tkin_p1_i6

#machinelearning #bigdata

Apache Spark est un puissant moteur open up-source de calcul distribué dédié au traitement de larges volumes de données. Avec Apache Spark, vous pouvez exécuter parallèlement les tâches concernant l’ingénierie des données (Data Engineering), la science des données (Information Science) et l’apprentissage automatique (Machine Learning) sur des machines. L’interface R de Spark est le package sparklyr qui fait l’objet de ce livre. Sparklyr supporte plusieurs packages connus de l’écosystème R dont dplyr qui est une puissante librairie dédiée à la l’analyse des données.

Ce livre axé sur la pratique vous permettra de comprendre facilement l’utilisation de Apache Spark dans R. Nous allons traiter une problématique concernant la modélisation du risque de crédit en utilisant les fonctionnalités de sparklyr pour l’analyse et la modélisation des données grâce à des algorithmes de Machine Learning.
A travers ce livre, vous apprendrez à :

installer Sparklyr et une model récente d’Apache Spark dans votre Personal computer
construire et évaluer des modèles de Machine Learning avec la librairie tidymodels
combiner sparklyr et tidymodels
réaliser une analyse exploratoire des données Significant Information en utilisant sparklyr et dplyr
afficher les requêtes équivalentes de codes dplyr
construire, entraîner et évaluer un pipeline de Machine Learning en utilisant Spark MLlib
optimiser un modèle de Machine Learning en réglant ses hyperparamètres
déployer un modèle de Machine Learning dans une application world-wide-web.

(Visited 1 times, 1 visits today)

You Might Be Interested In

LEAVE YOUR COMMENT

Your email address will not be published.