AI Security Research Portal
Sourcessourceseed2026-07-04ai-securityverbal-reinforcement-learningepisodic-memory-bufferreflectiontrajectory

Reflexion

Collection Summary

Weight update 대신 task feedback을 verbal reflection으로 변환하고 다음 trial의 context에 재사용하는 language-agent improvement framework다.

Evolution History Store