반응형
사람처럼 Visual information을 인식해 의미 있는 정보를 도출할 수 있도록 하는 AI 분야
Image Computing
Computer Vision / Computer graphics / Image processing
Computer Vision
이미지를 이해함으로써 정량적(quantitative) 데이터를 만드는 것.
- (non) Parametric modeling by optimization
- Numerical solutions
Computer graphics
그림이 아닌 정보(polygon, vector)에서 image로 변환하는 분야.
- 2D/3D geometry
- Physics modeling (for realistic rendering & animation)
Image Processing
이미지에서 이미지로 변환하거나 image에서 feature 추출하는 분야.
- Digital signal processing
Image
: 컴퓨터 비전에서, 그리드 형태의 픽셀 배열. (arrangement of pixel in a grid)
- 이미지는 2d function과 array로 정의될 수 있음.
- x와 y가 spatial coordinates이면 (x, y) = pixel.
- (x, y) = f(amplitude) → intensity(0(black)~255(white)) or color value
Pixel
: 정보를 담은 가장 작은 아이템.
- 각 픽셀은 color information을 담고 있음.
- 픽셀 개수가 해상도(resolution) 결정.
Input
Visual data.
image or video
Output
meaningful semantic information
- Low-level information
- Image manipulation (size, color, exposure)
- Resizing
- Grayscale
- Feature extraction
- Grayscale
- Image manipulation (size, color, exposure)
- Mid-level information
- Local feature matching
- Panoramas
- Multi-view stereo
- Structured Light Scan
- Range finding
- Optical Flow
- Structured light
- LiDAR
- High-level information
- Detection
- Object identity
- Segmentation
Challenges in Computer Vision
- 2D projections of the 3D world
- Light constancy
- Motion
- Photometric variations
- Repetitive Patterns
- Texture-less Surface
- Occlussions
- Reflections
반응형
'컴퓨터비전' 카테고리의 다른 글
[컴퓨터비전] 목차 (0) | 2023.11.19 |
---|