리뷰

[리뷰] 멀티모달 생성 AI 인사이드

손혜정 2024. 3. 24. 20:24

이번달 한빛미디어 리뷰어 책이 도착하여 읽어보았다.

 

 이 책은, AI에 관심있는 모든 사람에게 이 책을 추천한다고 되어있다.

 아무래도 기술서는 아니기 때문에 앞부분에 나와있는 기술적인 내용은 기술서보단 아쉬운점이 있지만, 후반부로 갈수록 앞부분에 나왔던 기술들이 바탕이 되어 나온 새로운 기술들에 대한 배경, 서로 다른 모델들에 대한 비교 등이 흥미로웠다,

 또한 현재 적용 가능한 다양한 분야와 방법들을 알려주니 생성형 AI 모델들에 대한 인사이트를 얻기 좋은 것 같다. 

 

표지 부터가 매우 인상적이다...

 

 일단 처음은 멀티 모달에 대한 내용으로 시작한다. 어떤걸 멀티 모달이라고 하는지? 그 어원과 실제 어떤 분야에서 쓰이고 있는지로 시작한다. 그리고 멀티 모달이 나오기 전까지의 기술 변천사에 대해서 나온다.

 

 참고로 멀티모달이다보니 TEXT, 이미지, 음성, 센싱/신호 데이터 등 다양한 resource의 데이터를 다루는 여러 모델들에 대해 나오는데, 아무래도 요새 주류인 TEXT, 이미지 중심으로 많이 나온다. 

(코드도 나오긴 하는, 최대한 간단히 작성하려고 했는지 VAE, GAN 같은 경우는 레이어 단위까지 나왔지만 확산모델은 이미 있는 모델을 가져다 사용하는 코드로 나와있고 그렇다.)

 

그리고 멀티모달이 속해있는 대범주, AI > 머신러닝 > 딥러닝 > ... 순으로 소개를 해주는데.. 변천사와 역사 부분은 재밌게 볼 수 있지만 이후 나오는 기술들에 대한 원리, 적용 코드 샘플부분은 비전공자들이 보기엔 조금 어렵지 않을까 싶다..

 (하지만 책에 나왔다시피 전부 다 이해하려고 할 필요 없이 이런 원리구나~ 하고 넘어간다면 재밌게 읽을 수 있을 것 같다. 특히 이 기술들을 바탕으로 나온 뒷 기술들의 변천사가 재밌기 때문에..)

모델들간의 비교 재밌다. 

 

어떤 모델이 어디에서 아이디어를 착안해서 나오게 되었는지, 어떤 모델들과 유사한 구조인지, 동일한 역할을 하지만 어떤면에서 차이를 보이는지 직접 알아볼 필요없이 책에서 잘 설명해준다. 

 

 

마지막으로는, 현재 이러한 멀티모달 생성AI가 각 산업에서 어떤 서비스를 제공하고 있는지, 빅테크들이 어떻게 경쟁을 하고 있는지, 최근 주요 이슈들이 어떤 것인지 나온다.

 

결론적으로, 이 책을 통해 멀티모달 생성형AI 기술의 변천사와 현재 트랜드를 알 수 있다.

다만, 앞부분 기술적인 내용이 조금 힘들면 가볍게 보고 뒷부분을 읽어보자 :)