U-Net: Convolutional Networks for Biomedical Image Segmentation
Abstract
- U-net: CV 중에서도 Biomedical segmentation 을 위해 나온 합성곱 신경망
- 네트워크 모양이 U자
- 기존 FCN(Fully Convolutional Network) 을 수정, 확장시키면서 적은 데이터로 빠르게 효과적인 성능을 뽑아낼 수 있음
1. Introduction
-
U-Net은 이미지의 전반적인 컨텍스트 정보를 얻기 위한 네트워크와 정확한 지역화(Localization)를 위한 네트워크가 대칭 형태로 구성되어 있음
-
FCN: 기존의 Visual Recognition task 의 Single Class Label
-
하나의 이미지가 무엇인지를 판단하는 것 → 각 픽셀이 무엇인지를 판단하는 단계로 넘어가 Segmentation 을 하는 목적
-
Segmentation Task 에서는
이미지의 위치정보
가 중요
- FC layer 를 거치며 벡터화 → 위치정보 사라짐
- Fully - Convolutional 한 네트워크 고안 → FCN
-
2. Network Architecture
- Skip Connection: Upsampling 시의 정확도를 높여주기 위해, 이전 Layer 의 Feature map을 넘겨받아 더해줌
- U-net: 좌측 input 부근의 Contraction Path 와 우측 output 부근의 Expansive Path , 그리고 그 둘을 이어주는 Bottle neck 부분으로 이루어짐
Contraction Path (수축 경로)
- convolution 연산부
- 2번의 3 x 3 convolution 연산 이후 ReLU activation Func 을 사용
- 2 x 2 , stride = 2 로 max pooling 을 진행
- 각 단계에서 나온 Feature Map 을 crop 하여 저장
- Padding이 없어 input path 와 output path 의 사이즈 차이가 나기 때문
Bottle Neck
- 3 x 3 conv , ReLU * 2
- Drop Out
Expansive Path (확장 경로)
- up sampling 을 하는 구간
- 똑같이 3 x 3 convolution 연산 2회
- 2 x 2 max pooling 대신, 같은 scale 의 up convolution 연산 수행
- 각 단계에서 대응되는 Contraction Path 의 Feature map 을 부착 (Conv 연산 전) → Skip Connection 효과
- Fully Convolutional Network 구조의 특성상 입력 이미지의 크기에 제약이 없음
- 따라서 크기가 큰 이미지의 경우 이미지 전체를 사용하는 대신 overlap-tile 전략 사용
- 다음 tile에 대한 Segmentation을 얻기 위해서는 이전 입력의 일부분이 포함되어야 함. → Overlap-Tile
- 이미지의 경계 부분 픽셀에 대한 세그멘테이션을 위해 0이나 임의의 패딩값을 사용하는 대신 이미지 경계 부분의 미러링을 이용한 Extrapolation 기법을 사용
Touching cells separation
- Segmentation 작업에서 주요한 과제 중 하나는 동일한 클래스의 접촉 개체를 분리하는 것
- 닿아 있는 세포 사이의 경계부분을 분리하기 위해 사전에 학습된 가중치 맵을 사용
- 이미지 c, d와 같이 각 세포 사이의 경계를 포착할 수 있어야 함
- 이를 위해 학습 데이터에서 각 픽셀마다 클래스 분포가 다른 점을 고려하여 사전에 Ground-Truth에 대한 Weight map을 구해 학습에 반영
3. Training
-
출력 값: 픽셀 단위의 Softmax로 예측
-
최종 특징 맵(채널 k)에 대한 픽셀 x의 예측 값
-
Loss Function
- Cross-Entropy 함수가 사용
- Touching Cells 분리를 고려하기 위해 Weight map Loss가 포함됨
4. Experiments
5. Conclusion
- U-Net은 FCN보다 확장된 개념의 Up-sampling과 Skip Architecture를 적용한 모델을 제안
- 결과적으로 아주 적은 양의 학습 데이터만으로 Data Augmentation을 활용하여 여러 Biomedical Image Segmentation 문제에서 우수한 성능을 보임