Charakterystyka i cel szkolenia

Celem kursu jest zapoznanie uczestników z procesem eksploracji danych.
Przedstawione zostaną podstawy dotyczące wybierania i reprezentacji danych, tworzenia modeli uczenia maszynowego a następnie oceny ich skuteczności. Aby utrwalić wiedzę i łatwiej zastosować ją po szkoleniu przygotowałem ćwiczenia do wybranych zagadnień.

Czas i cena szkolenia

Proponowane formy:

  • Standardowa - 2 dni x 7 godzin, 2500 PLN brutto (cena dla grupy do 5 osób)
  • Bootcamp - 1 dzień x 11 godzin, 1900 PLN brutto (cena dla grupy do 5 osób)
  • Bloki - 4 dni x 2 godziny (realizowane przez miesiąc), 2500 PLN brutto (cena dla grupy do 5 osób)
  • Inne - od 120 PN brutto za godzinę

Wymagania

Podstawy programowania w dowolnym języku. Przykłady implementacji algorytmów uczenia maszynowego oparte są o język Python.

Plan szkolenia

  1. Wprowadzenie do zagadnień nauki o danych

    • Co to jest Artificial Intelligence, Data Mining i Machine Learning
    • Obszary zastosowań sztucznej inteligencji, eksploracji danych i uczenia maszynowego
    • Eksploracja danych w procesie CRISP-DM
    • Krótki przegląd dostępnych rozwiązań darmowych i komercyjnych
    • Wiedza i dane konieczne w procesie budowania modeli Machine Learning
  2. Zrozumienie uwarunkowań biznesowych i danych

    • Proces oceny wykonalności i założenia PoC
    • Dostępne źródła wiedzy odnośnie dostępnych rozwiązań
    • Pozyskiwanie danych
    • Wstępna analiza danych
    • Klasyfikacja metod eksploracji danych: predykcja, klasyfikacja, klastrowanie
  3. Pierwszy model uczenia maszynowego (z ćwiczeniami)

    • Predykcja w oparciu o regresję liniową (Linear Regression)
    • Wybór i reprezentacja cech (Feature Extraction, Feature Selection)
    • Sposób powstawania modelu
    • Ocena dopasowania modelu
    • Jakie pułapki mogą się pojawić
  4. Wprowadzenie do metod uczenia nadzorowanego (z ćwiczeniami)

    • Regresja logistyczna (Logistic Regression)
    • K najbliższych sąsiadów (k-nn)
    • Naiwny klasyfikator bayesowski
    • Maszyna wektorów nośnych (SVM)
  5. Wprowadzenie do metod uczenia nienadzorowanego (z ćwiczeniami)

    • Klastrowanie (Clustering)
    • Wykrywanie anomalii (Anomaly detection)
  6. Sieci neuronowe w uczeniu nadzorowanym i nienadzorowanym (z ćwiczeniami)

    • Idea i budowa sieci neuronowej (artificial neural networks)
    • Dlaczego sieci neuronowe mogą okazać się najskuteczniejszym z algorytmów
    • Przegląd najpopularniejszych rodzajów sieci
    • Jak uczy się sieć (funkcje aktywacji i oceny błędu, propagacja wsteczna)
    • Sieci neuronowe w uczeniu nadzorowanym
    • Sieci neuronowe w uczeniu nienadzorowanym
  7. Ocena i wybór modelu (z ćwiczeniami)

    • Walidacja krzyżowa (Cross-validation)
    • Macierz wyniku działania modelu (Confusion matrix)
    • Interpretacja wartości recall (wyszukanie) i precision (precyzja)
    • Miara F1 (F1 measure/score)
  8. Co dalej

    • Inne popularne algorytmy
    • Kierunki rozwoju
    • Polecane materiały