Teaching

Gradient descent (GD) [notes]
- constant step-size GD, convergence analysis [slides]
- Advanced techniques & SGD [slides]
Ridge regression [notes]
- bias-variance trade-off [slides]
Principal component analysis (PCA) [notes]
- minimum reconstruction error view [slides]
- maximum variance view [slides]
Constrained optimisation
- PCA [slides][notes]
- Ridge regression [slides]
The kernel trick [slides][notes]

Generative models
- Intro to generative modelling [slides]
- Variational auto-encoders [slides] [notes]
- Generative adversarial networks [slides] [no t es]
- Recent advances in deep generative models [slides]
RNNs
- Intro to RNNs/LSTMs [slides] [notes]
- Applications (e.g. Seq2Seq) [slides]
Attention networks
- Attention basics & Transformer [slides] [notes]
- Recent advances in attention methods [slides]