반응형

전체 글 110

[Paper] ViT - Vision Transformer

Transformer를 sequences of image patches에 직접 적용해도 classification에서 뛰어난 성능을 보임!특징NLP에서 사용되는 Transformer를 Vision Task에 적용CNN구조 대부분을 Transformer로 대체 (입력단인 Sequences of Image Patch에서만 제외)대용량 데이터셋 Pre-Train → Small Image 데이터셋에서 Transfer Learning훨씬 적은 계산 리소스로, 우수한 결과를 얻음단, 많은 데이터를 사전 학습해야 된다는 제한사항 있음이미지를 patch의 sequence로 해석한 뒤, NLP에서 사용되는 표준 Transformer 인코더로 처리단순, 확장 가능, 대규모 데이터셋으로 사전 학습 → 좋은 성능SOTA와 동..

Paper 2025.01.19

[Paper] Transformer: Attention is All You Need

Attention mechanism만을 사용해 인코더와 디코더를 구성한 새로운 network특징CNN과 RNN을 완전히 제거하여 간단하고 병렬화가 용이하며, 훈련 시간도 크게 단축됨.Attention Mechanism만을 사용해 입력/출력 간 global dependencies 학습.큰/한정된 데이터셋에서 모두 우수한 성능을 보임. Multi-Head Attention동일한 데이터에 여러 개의 어텐션 메커니즘을 병렬로 적용모델은 데이터의 다양한 측면을 동시에 고려- 서로 다른 의미적/구문적 관계 학습 가능.다양한 의존성 동시 고려더 풍부하고 다차원적인 데이터 표현 수집/분석 Self-Attention같은 문장 내에서 단어들 간의 관계 고려Q, K, V가 모두 동일한 embedding vector에서 도출..

Paper 2025.01.14

[E2E 자율주행] (7)-8 Challenges: Long-tailed Distribution

Long-tailed Distribution일반적인 상황이 대부분이고, 안전과 직결적인 상황이 드물게 발생하는 data imbalance 문제.자주 발생하는 평범한 상황(차선을 따라가는 주행 등)이 대부분을 차지하는 반면, 안전에 중요한 드문 시나리오(사고 위험 상황 등)는 데이터셋에서 매우 희소하고 다양성이 부족합니다.이로 인해 모델이 드문 상황에서 일반화하고 적응하는 데 어려움을 겪음.많은 연구가 시뮬레이터에서 적대적 시나리오에 초점을 맞추고 있지만, 실제 데이터를 더 잘 활용하여 중요한 시나리오를 탐색하고 이를 시뮬레이션에 잠재적으로 적응시키는 것도 중요합니다.안전에 중요한 시나리오를 대상으로 엔드-투-엔드 자율주행 방법을 평가하기 위해 체계적이고, 엄격하며, 포괄적이고 현실적인 테스트 프레임워크가..

[E2E 자율주행] (7)-7 Challenges: Causal Confusion

End-to-End Autonomous Driving과 관련된 다양한 게시물은Introduction에서 확인하실 수 있습니다.  Causal Confusion 모델이 본질적 인과 관계를 학습하지 못하고 비본질적 상관관계(Spurious Correlations)에 의존하는 현상모델이 데이터에서 중요한 요인을 파악하기보다는, 쉽게 사용할 수 있는 shortcut 정보에 지나치게 의존함으로써 발생.자율주행 차량의 현재 행동은 속도나 과거 궤적과 같은 low-dimensional spurious feature와 강하게 연관될 수 있음.End-to-End 모델이 이러한 특징에 의존하게 되면 causal confusion이 발생할 수 있다.이는 모델이 진정한 인과 관계를 학습하지 못하고, 단순히 부차적 패턴에 의존..

[E2E 자율주행] (7)-6 Challenges: Interpretability

End-to-End Autonomous Driving과 관련된 다양한 게시물은Introduction에서 확인하실 수 있습니다. Interpretability자율주행에서 중요한 역할.엔지니어가 시스템을 더 잘 debug하게 해줌사회적 관점(societal perspective)에서 performance 보장public acceptance 촉진.‘black box’라고 불리는 E2E 자율주행에서 interpretability를 가진다는 것은, 필수적이고 중요한 과제.Sliency map(중요도 맵)훈련된 모델이 주어지면 X-AI 기법을 적용해 얻을 수 있음.모델이 planning에 의존하는 visual input의 특정한 영역 강조한정된 정보를 제공하고 효율성과 타당성(validity) 평가 어려움.mode..

[E2E 자율주행] (7)-5 Challenges: Policy Distillation

End-to-End Autonomous Driving과 관련된 다양한 게시물은Introduction에서 확인하실 수 있습니다. Policy DistillationImitation learning(또는 세부 항목인 behavior cloning)은 expert의 행동을 모방하는 지도학습이므로 일반적으로 Teacher-Student paradigm을 따름.이와 관련한 두 main challenges:Teacher(expert)가 완벽한 운전자가 아니지만 주변 agent와 map의 ground-truth에 접근 가능Student는 오직 sensor input으로 기록된 output에 의해 지도되므로 perceptual feature를 얻고 policy를 처음부터 학습(learning from scratch)해..

[E2E 자율주행] (7)-4 Challenges: World-model / Multi-task Learning

End-to-End Autonomous Driving과 관련된 다양한 게시물은Introduction에서 확인하실 수 있습니다.World-modelworld model이 policy model에 대한 명확한 future prediction을 제공하는 현재 model-based policy learning works의 challengesMBRLModel-Based Reinforcement Learning.high sample complexity를 겪음.agent를 실제 환경 대신 learned world model과 상호작용하는 방식으로 sample efficiency를 향상시킴.transition dynamics와 reward function으로 구성된 explicit world model 사용.주행에서 ..

[E2E 자율주행] (7)-3 Challenges: Visual Abstraction / Representation Learning

End-to-End Autonomous Driving과 관련된 다양한 게시물은Introduction에서 확인하실 수 있습니다.Dependence on Visual AbstractionEnd-to-End autonomous driving system에서의 두 단계:state를 latent feature representation으로 encodingintermediate features 기반으로 driving policy decoding.문제점도시 주행에서 주변 환경과 ego state가 매우 다양하고 고차원적.이는 representation과 policy making에 필요한 attention area의 불일치 발생 가능.해결Intermediate Perception Represenatation을 잘 설계..

[E2E 자율주행] (7)-2 Challenges: Sensing / Sensor-fusion / Input Modalities

End-to-End Autonomous Driving과 관련된 다양한 게시물은Introduction에서 확인하실 수 있습니다.Sensingmonocular camera: 초기 방식- Lane following 기술, 복잡한 상황을 처리하는 것에 한계RGB images from cameras: 인간의 시각적 정보 재현, 풍족한 의미론적 디테일LiDAR or stereo cameras: 정확한 3D 공간 정보 제공mmWave radars and event cameras: 객체의 상대적 움직임 포착Speedometers, IMU, 내비게이션 명령 등: 시스템을 안내하는 입력 데이터로 사용 Multi-sensor Fusion주로 object detection, semantic segmentation과 같은 pe..

[E2E 자율주행] (6)-3 Closed-loop: Sensor Simulation / Vehicle Dynamics Simulation / Benchmarks

End-to-End Autonomous Driving과 관련된 다양한 게시물은Introduction에서 확인하실 수 있습니다.Sensor Simulation시뮬레이터에서 image나 LiDAR 스캔 같은 raw data 생성 및 noise와 occlusion 반영한 현실적인 평가Graphics-Based3D environment model과 traffic entity model을 사용하여, 센서에서의 phisical rendering 과정을 근사(approximation)하여 데이터 생성.Ex) image에서 occlusion, shadow, and reflection 등 시뮬레이션.현실감 제한적, 높은 연산 비용 소요, 병렬 처리 어려움.3D model의 quality와 sensor modeling에 ..