Abstract.
There is large consent that successful training of deep net- works requires many thousand annotated training samples. In this pa- per, we present a network and training strategy that relies on the strong use of data augmentation to use the available annotated samples more efficiently. The architecture consists of a contracting path to capture context and a symmetric expanding path that enables precise localiza- tion. We show that such a network can be trained end-to-end from very few images and outperforms the prior best method (a sliding-window convolutional network) on the ISBI challenge for segmentation of neu- ronal structures in electron microscopic stacks. Using the same net- work trained on transmitted light microscopy images (phase contrast and DIC) we won the ISBI cell tracking challenge 2015 in these cate- gories by a large margin. Moreover, the network is fast. Segmentation of a 512x512 image takes less than a second on a recent GPU. The full implementation (based on Caffe) and the trained networks are available at http://lmb.informatik.uni-freiburg.de/people/ronneber/u-net.
deep networks에서 성공적인 training을 위해서는 수천장의 라벨링된 데이터가 필요하다는 것은 이미 자명한 사실이다.
우리 논문에서는 잘 라벨링된 데이터를 더욱 효율적으로 사용하기 위한 강력한 데이터 변형 방법에 기반되어지는 training 전략과 network를 보여줄 것이다.
아키텍처는 context를 저장하기 위한 contracting path와 정교한 localization을 가능하게 하는 대칭적 expanding path로 이루어져 있다.
우리는 network가 몇몇 이미지를 end-to-end방식을 통해 훈련시킬 수 있으며, ISBI의 최상의 모델인 a sliding-window convolutional network를 능가한다는 것을 보여준다.
이러한 network를 현미경 데이터에 이용해서, ISBI에서 큰 격차를 벌리면서 우승하였고, network가 빠르다.
우리가 사용한 GPU에서 512 * 512 를 segmentation하는데 1초도 걸리지 않았다.
code에 대한 내용은(by caffe) 위의 url에 있다.
Reference
Ronneberger, O., Fischer, P., & Brox, T. (2015, October). U-net: Convolutional networks for biomedical image segmentation. In International Conference on Medical image computing and computer-assisted intervention (pp. 234-241). Springer, Cham.