본문 바로가기
  • 책상 밖 세상을 경험할 수 있는 Playground를 제공하고, 수동적 학습에서 창조의 삶으로의 전환을 위한 새로운 라이프 스타일을 제시합니다.

Computer Vision29

[2024-1] 김경훈 - VoxelMorph : A Learning Framework for Deformable Medical Image Registration Link : https://arxiv.org/abs/1809.05231 VoxelMorph: A Learning Framework for Deformable Medical Image RegistrationWe present VoxelMorph, a fast learning-based framework for deformable, pairwise medical image registration. Traditional registration methods optimize an objective function for each pair of images, which can be time-consuming for large datasets or rich defoarxiv.org      0. Abstract 기.. 2024. 9. 10.
[2024-1] 김경훈 - UNet++ : A Nested U-Net Architecture for Medical Image Segmentation Link : https://arxiv.org/abs/1807.10165 UNet++: A Nested U-Net Architecture for Medical Image SegmentationIn this paper, we present UNet++, a new, more powerful architecture for medical image segmentation. Our architecture is essentially a deeply-supervised encoder-decoder network where the encoder and decoder sub-networks are connected through a series of nesarxiv.org     이번 포스팅은 객체를 인식하는 방법 중 .. 2024. 9. 5.
[2024-1] 한영웅 - DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation, CVPR 2023, Google Research, Boston University Abstract대규모 텍스트-이미지 모델은 주어진 참조 세트(reference set)에서 객체의 모양을 모방하고 다양한 맥락에서 새로운 표현을 합성하는 능력이 부족. 이에 저자들은 텍스트-이미지의 "개인화"(“personalization”)를 위한 새로운 접근 방식을 제시. 객체에 대한 몇 개의 이미지만 입력으로 주어지면 사전 훈련된 텍스트-이미지 디퓨젼 모델(DM)을 파인튜닝하여 해당 특정 객체와 고유 식별자를 바인딩하는 방법을 학습. 고유 식별자를 사용하여 다양한 장면에서 그 객체의 새로운 실제 같은 이미지를 합성할 수 있음. 새로운 자동 클래스별 사전 보존 손실 (autogenous class-specific prior preservation loss)과 새로운 데이터 세트 및 평가 프로토콜 (e.. 2024. 5. 29.
[2024-1] 김경훈 - SPVNAS : Searching Efficient 3D Architectures with Sparse Point-Voxel Convolution https://arxiv.org/abs/2007.16100 Searching Efficient 3D Architectures with Sparse Point-Voxel ConvolutionSelf-driving cars need to understand 3D scenes efficiently and accurately in order to drive safely. Given the limited hardware resources, existing 3D perception models are not able to recognize small instances (e.g., pedestrians, cyclists) very well due toarxiv.org   요약이 리뷰는 SPVNAS (Sparse Po.. 2024. 5. 21.