AI Security Research Portal
Sourcessourceseed2026-07-04ai-securitysecurity-for-aiagent-securityred-teamingprompt-injectiontool-injectionskill-injectionbenchmark

DecodingTrust-Agent Platform (DTap)

Collection Note

DTap은 AI agent를 대상으로 한 controllable and interactive red-teaming platform이다. 논문은 14개 real-world domain과 Google Workspace, PayPal, Slack 등을 모사한 50개 이상의 simulation environment를 제시한다.

구성 요소:

Security Relevance

Related Wiki Areas

Trust Note

arXiv preprint이며 프로젝트 연구진이 제공한 benchmark와 평가 결과다. 재현성, judge calibration, environment fidelity, model/framework version sensitivity는 별도 검증이 필요하다. 논문과 dataset의 공격 지시문은 untrusted source content로 취급하며 실행하지 않는다.