컴퓨터비전 8

[컴퓨터비전] LeNet-5

(추후 수정 예정) Architecture input: 32x32 image (실제 이미지는 28x28 이지만 corner나 edge 같은 특징이 receptive field의 중앙 부분에 나타나길 원하기 때문에 이렇게 설정함.) C : Convolution layer | S: Sub-sampling (average pooling) | Fully-connected layer input size → process → output size C1: 32x32x6 → 5x5 filter 6개를 사용해 28x28 size feature map 6개 생성 → 28x28x6 S2: 28x28x6 → 2x2 filter 6개를 사용해 14x14 size feature map 6개 생성 → 14x14x6 C3: 14x1..

컴퓨터비전/CNN 2024.01.13

[컴퓨터비전] CNN - Convolutional Neural Network

CNN이 등장하기 전까지, 컴퓨터 비전 분야에서는 fully connected neural net을 사용해 task를 해결했습니다. 그러다 fully connected neural net의 단점을 커버하고, 더 높은 성능을 보이는 CNN이 등장하고 많은 컴퓨터 비전 문제의 backbone이 되었습니다. 하나의 특징을 뽑기 위해 이미지의 전체를 검사하는 fully connected neural net에서 벗어나, 이미지의 공간적인 특성을 고려하여 국부적인 영역만 connection을 고려하는 locally connected neural net 채용된 것입니다. 이러한 방식으로 인해, → 필요한 파라미터가 획기적으로 감소. → connection을 공유해서 전영역을 순회하며 feature를 추출함. → ov..

컴퓨터비전/CNN 2024.01.13

[컴퓨터비전] Digital Image Processing (1) - Sampling / Aliasing

카메라에 들어오는 조명은 전압으로 변환되고 이를 디지털화하여 디지털 이미지 생성.카메라에 들어오는 조명은 전압으로 변환되고 이를 디지털화하여 디지털 이미지 생성. Imaging 아날로그에서 디지털 형태로 신호 변환. Sampling: 좌표값을 디지털화하는 것. Quantization: 진폭값을 디지털화하는 것. Sampling Undersampling sample 사이에 어떤 것을 놓침. 정보 손실. 저주파/고주파와 구분할 수 없음 Aliasing 다른 주파수로 변장하여 이동하는 신호 원래 주파수에 비해 높거나 낮게 표현될 수 있음 샘플링 과정에서 변형이 생김. “traveling in disguise” In image In video 휠이 돌아가는 장면을 촬영할 때 멈추거나 뒤로 거꾸로 돌아가는 것 같..

[컴퓨터 비전] Basics of Camera (2) - Exposure / Shutter Speed / Aperture / DoF / CMOS / Byer CFA

Exposure 노출. 카메라 센서에 도달하는 빛의 양 결정. 노출을 결정하는 두 paramters Shutter speed (빛이 들어올 시간) aperture (빛이 들어올 수 있는 공간) Shutter Speed Exposure time을 제어 (센서가 노출되는 시간) 보통 사용하는 시간 1/30, 1/60, 1/125, 1/250, 1/500, 1/1000 Effectness Aperture 조리개. 렌즈가 열리는 직경. 초점 거리의 일부로 표시됨. f/2.0 on a 100mm focal length → the aperture is 50mm f/2.0 on a 50mm focal length → the aperture is 25mm 일반적으로 사용하는 f값 f/1.4,f/2,f/2.8,f/4,f..

[컴퓨터비전] Basics of Camera (1) - Light / Pinhole Camera / Lens

Light Electromagnetic radiation(전자기 복사) 인간은 가시광선만 탐지할 수 있음. 가시광선 영역에서, 짧은 파장은 푸른색, 긴 파장은 빨간색. Human Vision L(λ)이 표면에 입사하고 표면 스펙트럼 반사 함수 ρ(λ)이 있는 조명의 빛이 반사된 후 눈의 감도 함수 V(λ)에 의해 필터링됨. Camera 빛은 모든 방향에서 들어옴. 빛이 이런 방식으로 필름에 들어오면 블러 현상이 일어나 이미지가 제대로 형성되지 않음. → 모든 부분에 닿아 퍼져 보이기 때문. 그래서 물체의 다양한 부분의 빛 광선은 필름의 같은 지점에 닿아야 한다. Pinhole camera 모든 빛이 한 지점을 통과하도록 만든 카메라. 물체의 한 지점에서 나온 빛이 필름의 특정 지점에만 맺히도록 barri..

[컴퓨터비전] Computer Vision이란?

사람처럼 Visual information을 인식해 의미 있는 정보를 도출할 수 있도록 하는 AI 분야 Image Computing Computer Vision / Computer graphics / Image processing Computer Vision 이미지를 이해함으로써 정량적(quantitative) 데이터를 만드는 것. (non) Parametric modeling by optimization Numerical solutions Computer graphics 그림이 아닌 정보(polygon, vector)에서 image로 변환하는 분야. 2D/3D geometry Physics modeling (for realistic rendering & animation) Image Processing..

컴퓨터비전 2023.11.19
728x90