Autonomous Driving/End-to-End Autonomous Driving

[E2E 자율주행] (7)-8 Challenges: Long-tailed Distribution

구코딩 2025. 1. 1. 23:58
반응형

Long-tailed Distribution

일반적인 상황이 대부분이고, 안전과 직결적인 상황이 드물게 발생하는 data imbalance 문제.

  • 자주 발생하는 평범한 상황(차선을 따라가는 주행 등)이 대부분을 차지하는 반면, 안전에 중요한 드문 시나리오(사고 위험 상황 등)는 데이터셋에서 매우 희소하고 다양성이 부족합니다.
  • 이로 인해 모델이 드문 상황에서 일반화하고 적응하는 데 어려움을 겪음.
  • 많은 연구가 시뮬레이터에서 적대적 시나리오에 초점을 맞추고 있지만, 실제 데이터를 더 잘 활용하여 중요한 시나리오를 탐색하고 이를 시뮬레이션에 잠재적으로 적응시키는 것도 중요합니다.
  • 안전에 중요한 시나리오를 대상으로 엔드-투-엔드 자율주행 방법을 평가하기 위해 체계적이고, 엄격하며, 포괄적이고 현실적인 테스트 프레임워크가 필수적입니다.

이를 완화하기 위해 다양한 데이터 처리 방법이 사용됨.

  • over-sampling
  • under-sampling
  • data augmentation
  • weighting-based approaches
  • handcrafted scenarios: 시뮬레이션에서 더욱 다양한 데이터를 생성
  • LBC: privileged agent를 활용하여 다양한 내비게이션 명령에 조건화된 imaginary supervisions 생성.
  • LAV: 데이터 다양성을 촉진하기 위해 non-ego agents의 trajectory를 학습에 포함합니다.
  • 희귀 사건 확률의 평가를 가속화하기 위해 중요 샘플링 전략을 적용한 시뮬레이션 프레임워크 제안.
  • adversarial attack을 통해 데이터 기반 방식으로 안전에 중요한 시나리오를 생성.
  • Bayesian Optimization을 사용하여 적대적 시나리오를 생성합니다.
  • Learning to collide: 운전 시나리오를 building blocks의 joint distribution로 표현하고, policy gradient RL을 적용해 위험한 시나리오 생성.
  • AdvSim: 물리적인 타당성을 유지하면서 실패를 유발하도록 agent의 trajectory 수정.
  • KING: 미분 가능한 kinematics model을 통한 기울기를 사용하여 safety-critical perturbation을 위한 최적화 알고리즘을 제안.
반응형