- Leren door doen
- Trainers met praktijkervaring
- Klassikale trainingen
- Gedetailleerd cursusmateriaal
- Duidelijke inhoudsbeschrijving
- Maatwerk inhoud mogelijk
- Trainingen die doorgaan
- Kleine groepen
In de cursus Data Analyse met Python leert u hoe u de Python taal en Python libraries kunt gebruiken in Data Analysis projecten.
De cursus Data Analyse met Python start met een behandeling in vogelvlucht van de Python syntax aspecten die belangrijk zijn bij Data Analyse projecten. Variabelen, data types, functies, flow control, comprehensions, classes, modules en packages worden besproken. Ook wordt ingegaan op de werking van de Jupyter notebooks, de IPython shell en het installeren van Python packages in Anaconda.
Vervolgens komt het NumPy package in de cursus Data Analyse met Python aan de orde, waarmee grote datasets zeer efficiënt verwerkt kunnen worden. Hierbij wordt NumPy’s ndarray object en zijn methodes besproken. Aandacht wordt besteed aan de verschillende array manipulatie technieken met broadcasting en vectorized operations.
Vervolgens staat het gebruik van Panda's op het programma van de cursus Data Analyse met Python. De pandas library introduceert twee nieuwe data structures in Python die gebruik maken van Numpy en daarom snel zijn. De data structures zijn DataFrame en Series en er wordt uitgebreid ingegaan hoe deze te gebruiken voor data analysis bij het inspecteren, selecteren, filteren, combineren en groeperen van data.
Ook wordt in de cursus Data Analyse met Python de MatPlotlib library besproken die nauw is geïntegreerd met NumPy en een zeer krachtig instrument vormt voor het creëren en plotten van complexe data relaties.
En tenslotte wordt aandacht besteed aan de essentials van de ScikitLearn library voor modellering. De cursus Data Analyse met Python maakt gebruik van vele voorbeelden uit de praktijk en laat zien hoe één- en twee- en drie dimensionale data sets kunnen worden gevisualiseerd.
De cursus Data Analyse met Python is bedoeld voor data analisten die Python en de Python libraries willen gebruiken in Data Analyse projecten.
Om aan deze cursus te kunnen deelnemen is kennis van en ervaring met een willekeurige programmeertaal of pakket zoals SPSS, Matlab of VBA wenselijk. De cursus start met de behandeling van de beginselen van de programmeertaal Python.
De theorie wordt behandeld aan de hand van presentaties. Illustratieve demo's verduidelijken de concepten. De theorie wordt afgewisseld met oefeningen. Als ontwikkelomgeving wordt de Anaconda distributie met Jupyter notebooks gebruikt. De cursustijden zijn van 9.30 tot 16.30.
De deelnemers krijgen na het goed doorlopen van de cursus een officieel certificaat Data Analyse met Python.
Module 1 : Python Language Syntax |
Module 2 : Functions and Modules |
Module 3 : Classes and Objects |
Python Features Running Python Anaconda Distribution IPython Shell Interactive and Script Mode Python Data Types Numbers and Strings Sequences and Lists Sets and Dictionaries Python Flow Control Exception Handling |
Pass by Value and Reference Scope of Variables EFAP principle What are comprehensions? Lambda Operator Filter, Reduce and Map List comprehensions Set and Dictionary comprehensions Creating and Using Modules import Statement from…import Statement |
Creating Classes Creating and Using Objects Accessing Attributes Property Syntax Constructors and Destructors Encapsulation Inheritance super Keyword Checking Relationships issubclass and isinstance Overriding Methods |
Module 4 : Numpy |
Module 5 : Pandas |
Module 6 : Data Manipulation |
NumPy Numerical Types Data Type objects dtype attributes Slicing and Indexing Array comparisons Manipulating array shapes Stacking and Splitting arrays any(),all(), slicing, reshape() Manipulating array shapes Methods of ndarray Views versus copies ravel(),flatten(),transpose() |
Pandas DataFrame Import Data Inspect Data Data Visualization DataFrame Data Types Indexing and selection Data operations in pandas Missing Data Hierarchical Indexing Plotting with Pandas Combining Datasets Exploratory Data Analysis |
Indexing Data Frames .loc and .iloc Accessor Slicing and Indexing a Series Filtering with Boolean Series Zeros and NaNs all and any Nonzeros Using map Function Hierarchical Indexing Rearranging Data Reshaping by Pivoting Transformation and Aggregation Grouping Data |
Module 7 : MatplotLib |
Module 8 : Time Series |
Module 9 : SciKitLearn Essentials |
Simple Plots Plot format String Subplots Histograms Logarithmic Plots Scatter plots Fill between Legend and Annotations Three Dimensional Plots Contour Plots Transformations Projections |
Indexing Pandas Time Series Reading and Slicing Times Using a DatetimeIndex Reindexing the Index Separating and Resampling Rolling mean and Frequency Resample and Roll with it Manipulating Time Series Method chaining and Filtering Missing values and Interpolation Time Zones and Conversion Plotting Time Series |
SkiKit Learn library Machine learning essentials Supervised and Unsupervised Feature matrix Target array Estimator API Hyperparameters Fit method Predict method Model Selection Linear Regression Logistic Regression |