Duration 34:54

PR-315: Taming Transformers for High-Resolution Image Synthesis

1 998 watched
0
32
Published 4 May 2021

PR12 315번째로 제가 발표한 논문은 올해 CVPR에서 Oral Session으로 발표될 "Taming Transformers for High-Resolution Image Synthesis"라는 논문입니다. 요즘 Transformer 구조를 language랑 vision 관계 없이 여기저기 적용해보려는 시도가 매우 다양하게 이루어지고 있는데요, 이 논문에서는 이미지의 각 patch를 encoding한 뒤, 그 vector들을 discrete codebook에 준비된 벡터들과 비교 후 대체하는 방식으로 quantize하는 방법을 제시하고 있습니다. ** 방송 기기 문제로 이번 영상은 아이패드 필기 없이 진행됩니다!! ** 논문 링크: https://arxiv.org/abs/2012.09841 슬라이드 링크: https://www.slideshare.net/HyeongminLee3/pr315-taming-transformers-for-highresolution-image-synthesis

Category

Show more

Comments - 2