챗GPT

멀티모달 이미지 생성 AI, 잠금 해제되다 - 온라인 콘텐츠의 제작 혁명

SERVICE DESIGN 2023. 3. 26. 16:36

사진 출처 : https://pixabay.com/images/id-7699865/

 

최근 몇 년 동안 인공 지능(AI) 분야는 전례 없는 성장을 경험했으며 의료에서 ​​금융에 이르기까지 수많은 응용 프로그램이 등장했다. AI 내에서 가장 흥미로운 개발 영역 중 하나는 이미지 생성이다. 이 기술을 통해 기계는 방대한 양의 데이터를 분석하는 딥 러닝 알고리즘을 사용해 사실적이고 상세한 이미지를 생성할 수 있게 되었다.

2022년 11월 30일 chatGPT가 출시되면서 AI계에 많은 사람들이 주목하게 된 가운데, 최근 OpenAI, Nvidia, Google 등 세계 유수 AI 기업들이 멀티모달* 이미지 생성 AI를 출시했다. 아래의 표는 2023년 2월부터 3월 중 발표된 신제품의 목록을 소개한 것이다.  
* 모달은 모덜리티(Modality)의 준말로 텍스트, 음성, 이미지, 영상 등 특정 형식의 의사소통 채널 형식을 의미함. 멀티모달 AI라고 하면 DALL-E와 같이 텍스트로 입력하여 이미지로 출력하거나 Runway처럼 텍스트로 입력해서 동영상으로 출력되는 등 두가지 이상의 모달을 전환, 활용하는 AI를 말함 

날짜 내용 비고 서비스URL 소개 영상
2.10. 런웨이(Runway), Gen-1 공개 텍스트 입력만으로 동영상 생성 가능 https://runwayml.com/ https://www.youtube.com/watch?v=WhlpL8XxqK0
3.15. 미드저니(Midjourney) ‘Midjourney V5’ 발표 (V4 발표가 2022년 11월이었음) 손가락 표현 문제 해결 https://midjourney.com/ https://www.youtube.com/watch?v=1bU8DzKVDbA
3.16. 마이크로소프트(Microsoft), ‘Microsoft 365 Copilot’ 발표 파워포인트, 엑셀 등 오피스 프로그램에 오픈AI의 GPT-4 기술 적용한 AI챗봇 탑재 https://www.microsoft.com/ko-kr/microsoft-365/microsoft-teams/group-chat-software https://youtu.be/Bf-dbS9CcRU
3.20. 알리바바(Alibaba), 모델스코프(ModelScope)에 AI가 탑재 됨을 발표 동영상 생성형 AI  https://www.alibabacloud.com/ko/product/modelscope https://youtu.be/9ErWgxSBMJ8
3.20. 런웨이(Runway), Gen-2 공개 Gen-1보다 더 정교한 동영상 생성 가능 https://runwayml.com/ https://www.youtube.com/watch?v=trXPfpV5iRQ
3.21. 엔비디아(NVIDIA), ‘Picasso’ 발표  텍스트로 이미지, 영상, 3D 생성 가능 https://www.nvidia.com/ko-kr/ https://www.youtube.com/watch?v=F_dSq1IT6ws
3.21. 어도비(Adobe), ‘Firefly’ 발표 텍스트로 레스터, 벡터이미지 생성 가능. 사용신청 접수중 https://www.adobe.com/kr/products/firefly.html https://www.youtube.com/watch?v=ifnAjKiMVaU
3.21. 마이크로소프트, 뉴 빙(New Bing) 발표. ‘이미지 크리에이터’ 탑재 정교한 이미지 생성 가능. 오픈AI의 이미지 생성 AI DALL-E 기반 https://www.bing.com/ https://youtu.be/7aekr13tdKI
3.21.? 마이크로소프트(Microsoft), 이미지 생성형 AI ‘디자이너(designer)’ 발표 그래픽디자인해주는 툴. 출시 예정, 사용대기 접수 받는 중 https://designer.microsoft.com/ https://youtu.be/7OWV0XLTBYE
3.21. 스테이블AI(Stability Al), ‘스테이블디퓨전 리이메진’(Stable Diffusion Reimagine) 출시 이미지로 다른 이미지 생성 가능 https://www.stability.ai/ https://www.youtube.com/watch?v=-wC4YhPBS-8
3.22. 캔바(canva), 비주얼 워크스위트(Visual Worksuite)에 AI기능 추가 매직 프레젠테이션, 매직 디자인 등 AI기능 추가로 디자인 작업 속도 향상 https://www.canva.com/ https://www.youtube.com/watch?v=YMQEjf0_C-M

표 : 2023년 2월부터 3월 현재까지 주요기업들이 발표한 새로운 서비스의 목록
       전종홍 님의 자료 https://t.ly/s_r_ 에서 발췌하고 일부는 추가함


이 기술은 정적인 이미지뿐만 아니라 비디오, 애니메이션 및 대화형 시각화도 만들어낼 수 있다. 이 혁신은 우리가 온라인에서 미디어를 만들고 소비하는 방식을 완전히 바꿀 수도 있다.

멀티모달 이미지 생성형 AI는 방대한 이미지 및 비디오 데이터 세트에 대한 딥 러닝 알고리즘을 교육하여 작동한다. 알고리즘은 데이터의 패턴과 기능을 인식하는 방법을 학습한 다음 입력의 스타일 및 내용과 일치하는 새 이미지를 생성하는 데 사용할 수 있다. 예를 들어 수천 개의 고양이 이미지로 훈련된 AI 모델을 사용하여 매우 사실적으로 보이는 새로운 고양이 이미지를 생성할 수 있다.

이 기술의 이점은 다양하다. 우선, 회사는 새로운 시각적 콘텐츠를 만드는 프로세스를 자동화함으로써 시간과 비용을 절약할 수 있다. 또한 각 고객에 대한 맞춤형 제품 이미지와 같은 개인화된 콘텐츠를 대규모로 생성할 수 있다. 그리고 가상 투어 또는 3D 제품 데모와 같은 대화형 몰입형 온라인 경험을 생성할 수 있는 새로운 가능성을 열어준다.

물론 이미지 생성 AI의 확산에 따른 위험성도 있다. 우선, 고품질 콘텐츠를 대규모로 생성할 수 있는 기계와 경쟁하기가 점점 더 어려워질 수 있는 아티스트와 디자이너의 대규모 이직, 전직으로 이어질 수 있다. 또한 잘못된 정보를 퍼뜨리거나 사기를 저지르는 데 사용될 딥페이크 동영상 생성으로 사회적 문제를 발생시킬 수 있는 등, 기술의 오용 가능성에 대한 우려도 있다.

이러한 우려에도 불구하고 이미지 생성 AI가 웹을 심오한 방식으로 변화시킬 잠재력을 가지고 있다는 것은 분명하다. 강력한 기술과 마찬가지로 신중하고 선견지명을 가지고 접근하는 것이 중요하지만 창의성과 혁신을 위한 새로운 가능성을 열 수 있는 잠재력을 부정할 수는 없다. 개인화된 제품 이미지에서 몰입형 가상 경험에 이르기까지 이 기술은 온라인 콘텐츠 생성 및 소비의 새로운 시대를 만들 것이다.


윤성원 + chatGPT
#chatGPT글쓰기

(질문) 
1. 최근 글로벌 AI 선도 기업들은 멀티모달 이미지 생성 AI를 출시하고 있습니다.
    이러한 트렌드의 의미에 대해 블로그 포스팅을 작성해 보세요. 제목은 '이미지 생성 AI가 웹을 강타하고 있습니다.'
2. 표는  전종홍 님의 자료 https://t.ly/s_r_ 에서 일부 내용을 발췌하고 서비스URL 등을 물어 확인하고 추가함.
   * 이 질문은 최근의 동향에 관한 질문이니만큼 bing.com 에서 했습니다.
3. SEO를 고려해서 이 블로그 포스팅에 적당한 제목을 제안해주세요.