author: sritank
score: 10 / 10

TODO: Summarize the paper:

ADAGRAD_step

ADADELTA_avg

ADADELTA_denom where epsilon is used to condition the denominator for numerical purposes.

ADADELTA_step

6epoch 6epoch_ADADELTA

audio

TL;DR