End-to-End Autonomous Driving과 관련된 다양한 게시물은Introduction에서 확인하실 수 있습니다. Policy DistillationImitation learning(또는 세부 항목인 behavior cloning)은 expert의 행동을 모방하는 지도학습이므로 일반적으로 Teacher-Student paradigm을 따름.이와 관련한 두 main challenges:Teacher(expert)가 완벽한 운전자가 아니지만 주변 agent와 map의 ground-truth에 접근 가능Student는 오직 sensor input으로 기록된 output에 의해 지도되므로 perceptual feature를 얻고 policy를 처음부터 학습(learning from scratch)해..