Verstärkendes Lernen ist ein Prozess, bei dem ein Lernendes System Entscheidungen trifft, auf deren Basis es anschließend handelt. Dazu verwendet es einen Algorithmus, der lernt die Erfolgsaussichten der einzelnen Aktionen in den verschiedenen Situationen besser einzuschätzen. Für die gewählten Aktionen erhält es positives oder negatives Feedback. Ziel des Systems ist, möglichst viel positives Feedback zu erhalten.