- Leren door doen
- Trainers met praktijkervaring
- Klassikale trainingen
- Gedetailleerd cursusmateriaal
- Duidelijke inhoudsbeschrijving
- Maatwerk inhoud mogelijk
- Trainingen die doorgaan
- Kleine groepen
In de cursus Machine Learning met R leert u hoe u de taal R en de R libraries kunt toepassen bij modellerings projecten en machine learning. Machine Learning is een onderdeel van artificial intelligence en betreft de bestudering van algoritmes die zich automatisch verbeteren op basis van ervaring. Machine learning algoritmes maken een model gebaseerd op training data en kunnen dan voorspellingen doen over nieuwe data.
Allereerst worden in een review de fundamentals van R besproken zoals data types en functies. Vervolgens komen een aantal belangrijke libraries zoals dplyr en ggplot2 aan bod.
Dan wordt ingegaan op de principes van machine learning, het bouwen van modellen op basis van data en de verschillen tussen supervised en unsupervised learning.
Lineaire regressie en logistische regressie en de verschillen ertussen komen aan de orde. Ook wordt besproken hoe modellen kunnen worden gecheckt op nauwkeurigheid door te kijken naar summaries, coëfficiënten en plots.
Vervolgens wordt ingegaan op hoe functionele programmeer technieken in R kunnen worden toegepast. Hierbij worden andere oplossingen voor iteratie middels diverse map en andere functions behandeld.
Ook is er aandacht voor de benadering van Apache Spark vanuit R door middel van een gedistribueerde data frame implementation met operaties als selection, filtering en aggregation.
Visualisatie in interactive web applicaties voor data representatie direct vanuit R via het Shiny package staat eveneens op het programma.
Dan komen in de cursus Machine Learning met R Decision Trees aan de orde. Dit Machine Learning algoritmes is gebaseerd op classificatie.
De cursus wordt afgesloten met de behandeling van diverse andere Machine Learning algoritmes zoals Naive Bayes, Principal Component Analysis en Support Vector Machines.
De cursus Machine Learning met R is bedoeld voor data analisten en data scientists die de R libraries willen gebruiken voor modellering en machine learning.
Om aan deze cursus te kunnen deelnemen is kennis van en ervaring met de programmeertaal R voor Data Analyse vereist. De nodige voorkennis met betrekking tot statistische methoden en algorithmen is bevordelijk voor de begripsvorming.
De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo's verduidelijken de concepten. De theorie wordt afgewisseld met oefeningen en case studies. De cursustijden zijn van 9.30 tot 16.30.
De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat Machine Learning met R.
Module 1 : R Review |
Module 2 : Machine Learning |
Module 3 : Linear Regression |
R Data Types Data Frames Factors Rmarkdown tidy package Functions in R Apply functions Statistics R Data Files Using dplyr Package Plotting with ggplot2 |
What is Machine Learning? Building Models of Data Model Based Learning Tunable Parameters Supervised Learning Discrete Labels Continuous Labels Classification and Regression Unsupervised Learning Data Speaks for Itself Clustering and Dimensionality Reduction |
Check Model Using Summary Using Coefficients Correlation R R Squared F Test Check Model Graphically Check Residuals Polynomial Regression Gaussian Basis Functions Overfitting |
Module 4 : Logistic Regression |
Module 5 : Functional R |
Module 6 : Sparklyr Intro |
Compare with Linear Regression Explore with Graphics Logistic Function Checking Model Using Summary Using Coefficients Calculate Probabilities Making Predictions Confusion Matrix Accuracy Precision and Recall ROC Curve |
Solving Iteration purr package library tidyverse map Functions Parameters of map .x as placeholder map_lgl Function map_int and map_char map2 Function Other iteration functions Combine purr with dyplr walk Function |
Spark Session Copy data into Spark File Setup Load data Spark SQL Store Data Using dplyr showquery() Spark DataFrame Functions sdf_pivot() Feature Transformers Distributed R |
Module 7 : Shiny |
Module 8 : Decision Trees |
Module 9 : Andere Algorithms |
Web Applications Shiny Architecture Shiny Server UI and Server Input Object Output Object Reactivity Render Options Shiny Functions Shiny Layout and Dashboard Shiny Performance |
Ensemble Learner Creating Decision Trees DecisionTreeClassifier Overfitting Decision Trees Ensembles of Estimator Random Forests Parallel Estimators Bagging Classifier Random Forest Regression RandomForestRegressor Non Parametric Model |
Naive Bayes Classifiers Gaussian Naive Bayes Principal Component Analysis Least Squares Polynomial Fitting Constrained Linear Regression K-Means Clustering Support Vector Machines Conditional Random Fields Explained Variance Dimensionality Reduction |