728x90

Machine Learning 8

Machine Vision-8. 딥러닝 모델을 효과적으로 학습시키기 위한 여러가지 창의적인 방법들 / 전이학습 / 캡슐 네트워크 / 앞으로의 방향

1. 전이 학습 앞서 설명한 모델들은 전부 모델을 충분히 학습시키기 위해 다양한 이미지로 구성된 대규모 데이터세트를 요구한다. 그러나, 데이터세트 자체가 구하기 어렵고, 비싸며 훈련 과정에서도 굉장한 계산 비용을 요구한다. CNN에 대한 설명을 할 때에, CNN은 이미지에서 일반적인 특성을 학습한다는 것을 말했다. 다시 말하자면 CNN의 얕은 층에서는 직선, 모서리, 색, 간단한 모양 등을 학습하고, 깊은 층에서는 이 간단한 요소들의 조합을 통해 질감, 형태의 조합, 물체의 일부분과 같은 부분을 학습할 수 있다. 전이 학습은 사전 훈련된 CNN의 특성 맵에 포함된 시각 요소를 재사용하여 새로운 종류의 물체를 인식하도록 하는 것이다. 간단히 말해 보조개 패턴과 같이 움푹 파인 패턴을 학습한 특성 맵을 원 ..

Machine Learning 2022.01.26

Machine Vision-7. 이미지 분할 딥러닝 모델 알고리즘 / Mask R-CNN / U-Net

1. 이미지 분할 사람의 시야는 일부분 겹쳐서 보이는 사물과 배경을 매우 쉽게 구분한다. 이러한 부분에서 불과 몇 면전까지 머신 러닝을 통한 영상 처리의 방법은 사람의 그것을 쉽게 뛰어넘을 수 없었다. 이를 해결하기 위해 이미지 분할 이라는 딥러닝 애플리케이션이 발전하였다. 객체 탐지를 목표로 하는 여러 모델들과는 여러 부분에서 다른데, 간단히 말하자면, 객체 탐지의 경우 대략적인 바운딩 박스로 물체의 위치를 정의하지만, 이미지 분할의 경우 픽셀 수준에서 객체의 위치를 예측한다는 점이 큰 차이이다. 유명한 모델로는 Mask R-CNN과 U-Net이 존재한다. 2. 이미지 분할 – Mask R-CNN Mask R-CNN의 경우 페이스북 AI 리서치(FAIR)에서 발표한 이미지 분할 모델이다.[1] 이 모델..

Machine Learning 2022.01.26

Machine Vision-6. 객체 탐지 딥러닝 모델 / R-CNN / Fast R-CNN / Faster R- CNN / YOLO

1. 객체 탐지 앞선 신경망 구조들은 이미지 분류에 초점을 맞춘 모델들이었다. 그렇다면, 고전적인 방법에서 많이 연구된 영상 처리를 통한 객체 탐지의 경우 딥러닝 모델에선 어떤 방식으로 구현할 수 있을까? 우선, 객체 탐지가 어떤 과정으로 이루어지는지 생각해보아야 한다. 객체 탐지의 경우 세 단계의 파이프라인으로 그 과정을 구성해볼 수 있다. 1. 관심있는 영역 찾기 2. 특성 추출 3. 특성에 따른 분류 이와 같은 파이프라인을 수행하는 모델은 대표적으로 R-CNN, Fast R-CNN, Faster R-CNN, YOLO가 있다. 2. 객체 탐지 – R-CNN R-CNN의 경우 UC 버클리의 로스 거쉭이 2013년 소개한 방법이다. 이 알고리즘은 사람의 어텐션 메커니즘을 본떠 만들어졌는데, 전체 장면을 ..

Machine Learning 2022.01.26

Machine Vision-5. 영상 인식을 위한 기초적인 딥러닝 알고리즘 / 신인식기 / LeNet-5 / AlexNet / VGGNet / 잔차 네트워크(Residual Network) ResNet

앞서 알아보았듯 인공지능의 발전은 영상 처리의 발전과 큰 연관성을 갖는다. 이제 영상 처리를 위해 신경망을 이용한 인공지능 알고리즘의 여러 종류를 알아보자. 1. 신인식기 / LeNet-5 1970년 후반, 허블과 비셀의 연구 결과로부터 감명을 받은 일본인 전자공학자 후쿠시마 구니히코(Fukushima Kunihiko)는 ‘신인식기’라 불리는 머신러닝 알고리즘에 대한 논문을 발표한다.[1] 이 알고리즘은 허블과 비셀의 연구를 인용하여, 생물학적 뉴런의 배열처럼 인공 뉴런을 계층적으로 정렬함으로 복잡하고 추상적 객체를 구분할 수 있음을 보였다. 이후, 얀 르쿤과 벤지오는 LeNet-5라는 신인식기보다 정확도와 효율성 면에서 큰 발전을 이룬 모델을 발표했다. 이 모델은 허블과 비셀의 연구와 후쿠시마 구니히코..

Machine Learning 2022.01.25

Machine Vision-4. 인공지능의 발전사 / 신경망 / 합성곱 신경망 / 허블과 토르스텐의 고양이 1차 시각피질 상호작용 실험

1. 인공지능의 발전사 인공지능의 발전사에 대해 조금 더 알아본다면, 딥러닝 알고리즘의 발전을 이해하기 더욱 쉽다. 1943년 워런 매컬러와 윌터 피츠는 뇌의 뉴런 개념을 발표했고, 1950년에 앨런 튜링은 인공지능과 사람의 수준을 비교하는 튜링 테스트를 제안한다. 이후 1956년 다트머스 AI컨퍼런스에서는 인공지능에 대한 전망을 낙관적으로 파악하는 등 이 시기를 기점으로 인공지능에 대한 학문적 발전이 태동하기 시작했다. 이후, 1957년 프랑크 로젠블라트가 사람의 시각뉴런을 수학적으로 모델링한 퍼셉트론을 발표하여 로지스틱 회귀의 기초를 놓았고, 1959년에는 앞서말한 데이비드 허블과 토르스텐 비셀이 고양이의 두뇌를 이용하여 시각 피질의 뉴런들의 상호작용 과정을 연구하여 노벨상을 수상하였다. 이후 이와 ..

Machine Learning 2022.01.25

Machine Vision-3. 해리스 코너 검출기 / SIFT 알고리즘

영상의 분할에 초점을 맞춘 여러가지 알고리즘을 이전의 포스트에서 알아보았다. 이러한 알고리즘이 개발된 후에도 여러가지 알고리즘에 계속해서 발전해왔는데, 그 중 대표적인 것이 해리스 코너 검출기 알고리즘과 SIFT 알고리즘이다. 이러한 알고리즘들은 대표적인 특성공학의 산물들이다. 첫번째 포스트에서 언급했듯 딥러닝 이전의 머신러닝은 특성공학을 통한 데이터의 특성 추출에 초점을 맞추었다. 이러한 방식은 실제로 사용될 정도로 어느정도 성공을 거두었지만, 실제 사람의 인식 수준에 비하면 걸음마 수준이었다. 특정한 상황에서 추출된 특성만을 인식할 수 있었고, 이 과정에서도 당시 하드웨어 수준에 비해 상대적으로 높은 계산복잡도를 갖고 있었다. 이로인해, 인식 정확도와 알고리즘의 범용성에서 한계가 존재했다. 해리스 코..

Machine Learning 2022.01.25

Machine Vision-2. 영상 계측을 위한 고전적 영역 분할 머신러닝 방법 / Clustering / 영역 성장 방법 / Split & Merge / 히스토그램 기반 영역 분할

과거엔 영상을 처리하기 위해 찾고자 하는 물체가 있는 영역과 없는 영역을 분할해야 했었다. 영역을 분할하는 방법에는 clustering, 영역 성장, 분할&통합, 히스토그램에 의한 영역 분할 방법이 있다. Clustering clustering은 cluster(부분집합)으로 패턴 벡터를 분할하는 처리이다. clustering에서 비슷한 값을 가지는 그룹으로 벡터들의 집합을 분할해야 한다. 벡터는 intensity 값, RGB 값, 계산된 특성, texture measurement와 같은 구성요소를 포함하고 픽셀 또는 그 주위의 값들로 표현된다. clustering방법에는 고전적인 clustering 방법, iterative K-Means clustering 등이 있다. 영역 성장 방법 영역 성장 방법에서..

Machine Learning 2022.01.25

Machine Vision 1. 개요 / 영상처리 기술의 발전사 / 영상의 정의 / 영상 처리의 단계 / 특징 추출 / 분할 계측 / 패턴 매칭 / 고전적 방법의 한계점

더보기 2022 경희대학교 응용수학과 공모전 참여 보고서를 기반으로 함. I.서론 기계가 영상을 인식하고, 이를 바탕으로 대상물을 분류, 재처리하는 기술은 영상 처리라는 분야로 정의되어 다양한 기법을 통해 발전해왔다. 1959년 홉킨스대학교의 생리학자 데이비드 허블과 토르스텐 비셀이 수행한 우리의 뇌에서 시각정보를 받는 대뇌피질의 첫번째 부분인 일차 시각피질에 있는 개별뉴런의 활동에 대한 연구[1]는 두뇌가 어떻게 시각적 정보를 인식하는지에 대한 기초적인 매커니즘을 제시하였다. 영상 처리는 크게 두개의 갈래로 나누어져 발전해왔는데, 전통적인 머신러닝 방법을 통해 대상물을 인식하는 방법, 머신러닝 중 딥러닝을 통해 대상물을 인식하는 방법이라는 두개의 갈래로 발전했다.[2] 이와는 별개로, 대뇌피질의 작동과..

Machine Learning 2022.01.25