컴퓨터비전

[컴퓨터비전] Computer Vision이란?

구코딩 2023. 11. 19. 15:55
반응형

사람처럼 Visual information을 인식해 의미 있는 정보를 도출할 수 있도록 하는 AI 분야

Image Computing

Computer Vision / Computer graphics / Image processing

Computer Vision

이미지를 이해함으로써 정량적(quantitative) 데이터를 만드는 것.

  • (non) Parametric modeling by optimization
  • Numerical solutions

Computer graphics

그림이 아닌 정보(polygon, vector)에서 image로 변환하는 분야.

  • 2D/3D geometry
  • Physics modeling (for realistic rendering & animation)

Image Processing

이미지에서 이미지로 변환하거나 image에서 feature 추출하는 분야.

  • Digital signal processing

Image

: 컴퓨터 비전에서, 그리드 형태의 픽셀 배열. (arrangement of pixel in a grid)

  • 이미지는 2d function과 array로 정의될 수 있음.
  • x와 y가 spatial coordinates이면 (x, y) = pixel.
  • (x, y) = f(amplitude) → intensity(0(black)~255(white)) or color value

Pixel

: 정보를 담은 가장 작은 아이템.

  • 각 픽셀은 color information을 담고 있음.
  • 픽셀 개수가 해상도(resolution) 결정.

 

Input

Visual data.

image or video

 

Output

meaningful semantic information

  • Low-level information
    • Image manipulation (size, color, exposure)
      • Resizing
      • Grayscale
    • Feature extraction
      • Grayscale
  • Mid-level information
    • Local feature matching
    • Panoramas
    • Multi-view stereo
    • Structured Light Scan
    • Range finding
    • Optical Flow
    • Structured light
    • LiDAR
  • High-level information
    • Detection
    • Object identity
    • Segmentation

Challenges in Computer Vision

  • 2D projections of the 3D world
  • Light constancy
  • Motion
  • Photometric variations
  • Repetitive Patterns
  • Texture-less Surface
  • Occlussions
  • Reflections
반응형

'컴퓨터비전' 카테고리의 다른 글

[컴퓨터비전] 목차  (0) 2023.11.19