본문 바로가기
  • 책상 밖 세상을 경험할 수 있는 Playground를 제공하고, 수동적 학습에서 창조의 삶으로의 전환을 위한 새로운 라이프 스타일을 제시합니다.

Computer Vision134

[2025-1] 한영웅, 전윤경 - UNet++: Redesigning Skip Connections to Exploit Multiscale Features in Image Segmentation (IEEE 2019) IntroductionUNet++는 의료 영상 분할에서 널리 사용되는 U-Net 및 FCN(Fully Convolutional Networks)의 한계를 극복하기 위해 제안된 새로운 신경망 구조.기존 U-Net의 두 가지 주요 문제:최적 네트워크 깊이의 불확실성:U-Net과 같은 인코더-디코더 구조에서 네트워크의 최적 깊이는 태스크의 난이도와 학습 가능한 데이터 양에 따라 달라질 수 있음.제한적인 스킵 연결 (skip connection) 설계:기존 U-Net의 스킵 연결은 동일한 해상도의 인코더와 디코더 특징 맵만 결합하도록 강제.그러나 이러한 동일 해상도 특징 맵은 의미적으로 유사하지 않을 수 있으며, 이러한 설계가 최적이라는 이론적 근거도 없음.UNet++의 해결 방안:다양한 깊이를 가진 U-Net.. 2025. 1. 8.
[2025-1] 황영희 - Deep Residual Learning for Image Recognition https://arxiv.org/abs/1512.03385 Deep Residual Learning for Image RecognitionDeeper neural networks are more difficult to train. We present a residual learning framework to ease the training of networks that are substantially deeper than those used previously. We explicitly reformulate the layers as learning residual functions witharxiv.orghttps://arxiv.org/abs/1603.05027 Identity Mappings in De.. 2025. 1. 4.
[2025-1] 임재열 - DDPM(Denoising Diffusion Probabilistic Models) DDPM(Denoising Diffusion Probabilistic Models)은 2020년 Jonathan Ho 등이 제안한 모델입니다. [DDPM]https://arxiv.org/abs/2006.11239 Denoising Diffusion Probabilistic ModelsWe present high quality image synthesis results using diffusion probabilistic models, a class of latent variable models inspired by considerations from nonequilibrium thermodynamics. Our best results are obtained by training on a weighted .. 2025. 1. 4.
[2024-2] 유경석 - YOLOv5, YOLOv9, YOLOv11 [YOLOv5]https://arxiv.org/pdf/2304.00501v6 YOLOv5는 따로 오피셜 논문이 있지는 않지만, 위 survey 논문에서 YOLOv5의 구조와 특징에 대해 간략하게 설명하였다.YOLOv5YOLOv4 이후 몇 달만에 출시한 경량화 모델로, Darknet 대신 Pytoch에서 개발됨다양한 Scale 버전 : YOLOv5n (nano), YOLOv5s (small),  YOLOv5m (medium),  YOLOv5l (large), YOLOv5x(extra large)로 나뉘어 각각 어플리케이션과 하드웨어 사양에 맞게 convolution layer의 폭과 깊이가 차이남.YOLOv4 이후 성능 개선 : 속도는 더 빠르고, 더 높은 정확성을 보임.MS COCO data set te.. 2025. 1. 4.