ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 컴퓨터 비전 분야에서의 딥 러닝 응용 사례#1
    Coursera 2023. 8. 27. 02:26

    컴퓨터 비전으로 무엇을 할 수 있는가?에 대한 대답은 컴퓨터 비전으로 해결하고자 하는 문제들에는 무엇이 있는가와 같은 질문이라 할 수 있다. 아래 컴퓨터 비전 영역의 문제들을 소개한다.

     

     

    1. recgnition 인식.

    : 내 이미지가 특정 대상을 포함하는가?라는 질문에 대한 해답.

     

    2. tracking / segmenting 객체 추적 또는 분할

    : 이미지의 어떤 부분 즉, 어떤 픽셀이 어떤 객체에 속하는지 파악하고 영상의 그다음 이미지에서 같은 객체를 찾아내는 것. 기본적으로는 객체를 분할한 뒤 연속된 여러 이미지를 따라 객체를 추적하는 것

     

    3. motion estimation / motion analysis 움직임 추정 / 움직임 분석

    : 움직임 추정 및 움직임 분석. 예를 들어 자율주행차를 운전하는 중이라면 여러 대의 카메라를 통해 촬영된 장면으로부터 그 안에 보이는 객체를 분석하는 시스템이 여기에 해당한다. 그리고 객체의 속도를 파악하는 것. 무언가에 부딪힐 만한 상황인지 누군가 오고 있는지 또는 어떤 사람이나 객체가 다가오고 있는지 등을 분석한다.

     

    4. pose estimation 자세 추정

    : 이미지에 사람이 한 명 또는 여러 명이 있을 때 뛰는 중인지 축구를 하는 중인지 춤을 추는 중인지 이러한 질문에 답하는 것. 이는 특정 활동을 인식하는 것을 의미

     

    5. Scene reconstruction 장면 재구성

    : 드론이 어떤 장소 주변을 날아다니도록 해서 여러 관점에서 다수의 이미지를 촬영한 다음 그 모든 이미지의 데이터를 활용해 장면을 3D로 재구성하는 것. 여기에는 3D 장면 모델링도 포함된다. 드론을 프랑스에 있는 오래된 교회 주위로 날려서 모든 방향 및 높이에서 촬영하거나 비너스 상과 같은 조각상의 사진을 여러 방향에서 카메라로 촬영한 다음 조각상이나 교회의 3D 모델을 만드는 것이다. 이를 10년이 흐른 뒤 다시 반복하면 해당 객체가 얼마나 손상되었는지 또는 얼마나 바뀌었는지를 비교할 수 있다.

     

    6. visual servoing

    : 비주얼 서보잉에서도 드론이 사용된다. 카메라 한두 대가 달린 드론을 날려서 한 구역을 감시하도록 하는 것으로 단순히 이미지에서 특정 사람이나 객체를 감지하는 그런 수준의 감시가 아니라 해당 구역을 순찰함과 동시에 그 구역의 지도를 구축해서 그 지도상에서 드론, 즉 카메라가 어디에 있는지 파악하고 날아다니며 감시를 계속하는 와중에도 여러 방향으로 지도를 만들어 나가는 것이다.

     

    7. Image restoration

    : 오래된 이미지가 있는데 어떤 이미지 정보나 품질이 손상된 경우 컴퓨터 비전 알고리즘을 활용해 정보를 복원하는 것이다.

     

    * recognition의 활용 사례

    인식, 분류 그리고 더 나아가 식별 그리고 위치 표시를 통해 특정 객체, 즉 구체적 객체나 조건을 감지할 수 있는지를 알아본다.

    1. face detection 얼굴 감지

    - iris scanning technology 홍채 스캔 기술(홍채의 패턴 즉, 홍채 안의 선을 보는 것)

     

    2. optical character recognition(OCR) 광학 문자 인식

    - 과속 단속 카메라에서 차량 번호판 인식

    - 구글 렌즈 : 텍스트를 식별할 수 있을 뿐만 아니라  바로 텍스트의 번역을 제공한다 따라서 다른 국가에 가서 카메라로 식당 메뉴판을 향하게 하면 앱이 영어로 번역한 결과를 화면 내에서 해당 텍스트 위에 띄워준다. 식물이나 동물을 식별할 수도 있다. 당신이 등산을 가서 새로운 식물을 발견했는데 무엇인지 궁금하다면 휴대폰으로 가리키기만 해도 구글 렌즈가 가능하다면 무슨 식물인지 알려 줄 것이며 어제 공원에서 본 개가 무슨 종인지도 알 수 있다.

     

    3. smile detection

    - poto selection; facial expression analysis : 예를 들자면 사진을 여러 장 찍었는데 모두가 웃고 있거나 대체로 긍정적인 표정을 지은 사진만을 남기고 싶은 경우

     

    - 사용자 경험(UX; user exprerience)을 분석하는 애플리케이션을 떠올려 볼 수도 있다. 여러분이 박물관에 갔는데 두 종류의 전시가 있다고 해보자. 여러분이 그중 하나에 더 긍정적인 반응을 보일 수 있을 것이다. 이런 분석을 전시관 앞을 지나가는 모든 사람에 대해 수행해서 준비한 전시가 얼마나 성공적이었는지 알아낼 수 있다.

     

    - patient monitoring : 환자가 긍정적인 감정을 보이고 있는지 환자가 편안한지 미소 짓고 있거나 웃고 있는지를 알면 원격 검진으로 병원에서 환자를 검진하여 환자의 상태가 더 나아졌는지를 판단할 수 있다.

     

    4. Amazon Go 스토어

    - 직원이 필요 없는 가게를 만들 수 있을까? 고급 컴퓨터 비전 알고리즘을 갖춘 카메라 여러 대만 있으면 가능하다. 먼저 고객들이 입장함에 따라 그들을 추적한다. 고객을 추적해서 어떤 객체를 진열대에서 집어 가는지 추적하고 장바구니에 객체를 집어넣는지 또는 진열대에 다시 돌려놓는지 파악할 수 있다. 그러면 고객이 가게를 떠날 때 장바구니에 무엇이 들었는지 정확히 알 수 있다. 따라서 자동으로 비용을 계좌에 청구할 수 있으며 고객들은 자신이 구매한 물건이 결제된 것을 확인한 후 안심하고 집으로 향할 수 있다. 여전히 개발 중인 기술이긴 하지만 점점 도입되고 있으며 앞으로 더 많이 보게 될 것이다.

     

     

    * 출처

    coursera, '컴퓨터 비전 분야에서의 딥러닝 응용 사례' 1강 

    댓글

Designed by Tistory.