Dzień 1: Przetwarzanie Danych i Metody Nienadzorowane
Sesja poranna:
Przetwarzanie i przygotowanie danych
- Wprowadzenie do kursu i oficjalne rozpoczęcie
- Wykład – zbieranie i przetwarzanie danych
- Znaczenie jakości danych w analizie danych chemicznych.
- Wprowadzenie do źródeł danych i metod zbierania danych.
- Techniki przetwarzania danych do radzenia sobie z brakującymi wartościami, duplikatami i wartościami odstającymi.
- Sesja code-along z prowadzącym (Python)
- Techniki przetwarzania i przygotowywania danych w Pythonie
- Wykorzystanie dedykowanych bibliotek do data science
Sesja popołudniowa:
Wprowadzenie do Analizy Danych Chemicznych i Nienadzorowanego Uczenia Maszynowego
- Wykład – wstęp do analizy danych chemicznych
- Specyfika analizy danych chemicznych i ich rodzaje (deskryptory struktury chemicznej, właściwości)
- Popularne bazy danych chemicznych
- Metody nienadzorowanego uczenia maszynowego w chemii z przykładami
- Sesja code-along z prowadzącym (Python)
- Wykorzystanie Pythona i API publicznych baz do automatyzacji generowania dataset’ów danych chemicznych
- Wykorzystanie wygenerowanych datasetów w wielowymiarowej analizie danych, przykłady różnych algorytmów nienadzorowanego uczenia maszynowego (grupowanie, analiza składowych, klastrowanie)