생성형 ai를 위한 컴퓨터 비전

1 minute read

img1

서평단으로 선정되어 도서를 일독한 후 남기는 후기입니다. 저는 자연어쪽 생성형 모델에 대해서는 익숙한 편이나, CNN 이후의 비전쪽 동향에 대해서는 이름만 아는 정도였습니다. 그러던 차에 이 도서의 서평 이벤트를 보고 공부해볼 기회다 생각하여 신청하였습니다.

이 책은 오토인코더, GAN, Diffusion 등 기초 모델을 먼저 학습한 뒤(2장), GAN(3장)과 Diffusion(4장) 기반의 다양한 응용 모델을 학습하는 순서로 구성되어 있습니다. 각 모델별로는 먼저 이론적 배경을 설명한 뒤 이를 코드로 구현하고 있습니다. 이론 설명과 코드 구현의 예시는 이런 식입니다.

img2

img3

이 책의 특징은 이론적 배경의 설명이 꽤 자세하다는 것입니다. 단순히 모델의 구조를 소개하는 정도에서 그치는 것이 아니라 각 모델별 특징과 새롭게 도입된 요소를 수식과 함께 서술하고 있습니다. 따라서 본문의 내용만 잘 이해할 수 있다면 각 모델의 기반 논문을 따로 읽지 않아도 될 정도로 보입니다. 다만 이런 내용을 모두 이해하기 위해서는 확률론과 딥러닝에 대한 이론적 기초가 필요합니다. 모델의 구현 코드 또한 핵심 부분만 설명하는 것이 아니라 세부 디테일적인 부분까지 많이 다루고 있어서 코드를 꼼꼼히 읽어본다면 모델을 이해하는데 도움이 됩니다.

전반적으로 이 책을 다 읽고 나니, 생성 모델 기반의 비전 연구의 흐름이 어떻게 지금에 이르렀는지에 대해 이해할 수 있을 정도의 지식은 갖춘 것 같습니다. 저처럼 딥러닝의 다른 분야를 공부한 사람들에게 비전 분야의 개요서로 추천합니다.

#비제이퍼블릭 #컴퓨터비전 #인공지능 #생성형AI #머신러닝 #딥러닝 #생성모델 #비전생성모델 #파이썬 #파이토치 #텐서플로 #케라스 #사이킷런 #python #pytorch #tensorflow #keras #scikitlearn

Updated:

Leave a comment