Posilňované strojové učenie
Posilňované učenie (niekedy sa nazýva aj spätnoväzbové, v angličtine Reinforcement Learning) je typ strojového učenia, pri ktorom necháme stroje, aby niečo skúšali samy (metodou pokus / omyl), a následne im dávame spätnú väzbu prostredníctvom tzv. politík. Stroje si na základe vhodnej spätnej väzby vyvíjajú stratégie správania. Napríklad, ak by sme chceli vyvinúť robota, ktorý sa naučí prechádzať bludiskom, robot by získaval pozitívnu odmenu za každý krok správnym smerom a negatívnu odmenu za chyby alebo slepé uličky. Postupne by sa tak naučil nájsť optimálnu cestu bludiskom.