카카오브레인 "내년 글로벌 최대 텍스트·이미지 넘나드는 AI 공개"


링크 21.12.20. 뉴시스 이진영 기자

김일두 대표 초거대 AI 기자간담회
내년 멀티모달 AI 공개
교육·신약개발도 초거대 AI 혁신 추진

[서울=뉴시스] 이진영 기자 = 김일두 카카오브레인 대표는 20일 “내년 초 글로벌 최대 규모의 ‘멀티모달(multi-modal) 인공지능(AI)’을 구축해 공개하겠다”고 발표했다.

김 대표는 이날 ‘초거대 AI’ 로드맵 온라인 기자간담회를 열고 “내년 초 공개할 초거대 AI 모델은 언어로 표현한 글과 이미지를 동시에 함께 이해할 수 있다”면서 이같이 밝혔다.

기존 AI 연구는 언어면 언어, 이미지면 이미지, 단일화된 모델이 주였는데, 이미지와 텍스트를 같이 이해하는 쪽으로 연구가 가속화되고 있다. 이런 가운데 멀티모달 AI는 텍스트, 이미지, 영상 등 다양한 영역을 AI가 동시에 이해하고 복합적인 결과물을 도출할 수 있는 ‘초거대 AI’의 한 종류이다.

그는 또 “구글은 18억건의 멀티모달 AI 데이터셋을 구축했고, 오픈 AI도 10억건 이상을 만들어 선도 중”이라면서 “카카오브레인은 정제를 거친 20억건 수준의 이미지-텍스트 쌍으로 구성된 데이터를 기반으로 사람 같은 AI를 실현할 수 있도록 연구하고 있고, 내년 1월 중에 일부를 공개, AI 산업 전반에 기여할 수 있는 방안도 검토 중”이라고 언급했다.

특히 그는 “내년 초 공개할 AI 모델은 언어로 표현한 글과 이미지를 동시에 함께 이해할 수 있는 AI 모델”이라면서 “상당히 복잡한 텍스트를 놓고도 관련된 이미지를 잘 찾아낼 수 있다는 점에서 포털 ‘다음’, 커머스 등에서 이미지 검색 수요를 많이 해결할 것으로 본다”고 내다봤다.

앞서 카카오브레인은 초거대 AI 모델 ‘코지피티’(KoGPT)와 ‘민달리’(minDALL-E)를 오픈소스로 공개한 바 있다. 코지피티는 한국어를 사전적, 문맥적으로 이해하고 이용자가 원하는 결과 값을 보여주는 한국어 특화 언어모델이다. 민달리는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다.

내년 공개하는 멀티모달 AI는 민달리를 더욱 고도화해 텍스트와 이미지를 자유자재로 이해하는 두번째 멀티모달 AI이자, 세번째 초거대 AI 모델인 것이다. 가령 이미지를 글로 표현하거나 글에 적합한 이미지를 검색하고 찾아낼 수 있다. 여기에 내년엔 영상도 AI가 이해할 수 있게끔 개발한다는 계획이다.

최근 빅테크 기업들이 초거대 AI 개발 경쟁을 본격화한 가운데 경쟁자인 네이버 ‘하이퍼클로바’는 파라미터(컴퓨터프로그램의 함수에 입력되는 데이터들로, AI 모델의 크기를 의미함)가 2040억개, LG 엑사원은 3000억개에 달하는데, 카카오 KoGPT는 파라미터수가 300억개, 민달리는 14억개에 그친다.

이에 파라미터 규모 기준으로는 카카오가 경쟁력이 부족하다는 지적이 나오자 김 대표는 “규모가 커지면 속도가 느려지고 학습과정이 복잡해지며 비용이 증가한다”면서 “무작정 사이즈를 키우는 것보다는 실용적으로 쓸 수 있는 규모의 언어모델을 타사 최고 크기 모델과 비등한 수준의 성능으로 끌어올리는 것을 목표로 한다”고 답했다.

이어 “내년 상반기 중 지금보다 성능을 더 올려 최대 800억 파라미터까지 예상하고 있다”면서 “언어와 이미지를 섞는다든지, 멀티모달을 선도적으로 한다는 것이 차별점이다”고 강조했다.

카카오브레인은 또 초거대 AI를 헬스케어, 교육 분야를 중심으로 적극 활용한다는 계획을 제시했다.

가령 초거대 AI를 질병 하나를 딱 집어서 적용하기보다는 일반화된 신약 개발 프로세스를 간소화하는 데 활용하는 방식으로 접근한다는 것이다. 김 대표는 “헬스케어 CIC와 협력 지점을 논의 중”이라고 전했다.

이달 초 카카오는 디지털 헬스케어 사업을 담당할 사내독립기업(CIC)을 설립했으며, 카카오브레인도 AI를 토대로 한 신약 설계 플랫폼 ‘갤럭스’에 50억원을 투자했다.

교육 분야에서는 언어 교육이나 코딩교육에서 AI가 도와줌으로써 교육분야에서 큰 혁신을 일으킬 것이라고 관측했다.

디지털휴먼에 대한 선행 기술도 연구하고 있다고 전했다. 최근 카카오는 초거대 AI라는 기능적인 측면에 인공의 캐릭터나 가상의 사람 모습을 결합해 궁극적으로 카카오의 모든 이용자에게 친근하면서도 유용한 디지털 휴먼을 완성해나가고자 한다는 구상을 공유한 바 있다.

김 대표는 “디지털 휴먼 서비스는 대중화를 이끌며 고부가가치를 추구하는 게 핵심”이라면서 “모든 사람에게 주치의가 있다면 어떻게 될까라는 모순적인 질문도 기술을 활용하면 가능하게 된다”고 분석했다.

이 밖에 카카오브레인 인력 운용 계획에 대해서는 스톡옵션을 보상 중 하나로 고민하고 있다고 알렸다.

김 대표는 “인력을 무작정 키우는 것보다는 120~160명 사이즈를 유지하고 헬스케어나 교육 등의 분야에서 집중적 투자가 필요하다고 생각이 들면 카카오 계열사들의 도움을 받는 식으로 진행할 것”이라며 “스톡옵션이 매력적인 편이라 구성원들 보상 패키지 중 하나로 보고 있다”고 말했다.

◎공감언론 뉴시스 mint@newsis.com


2. 키워드 : #kakao #AI

3. 요약 : 카카오브레인, 내년 중 초거대AI 공개

4. 궁금한 점 : 앞으로 헬스케어, 교육 등 분야에서 회사마다 모델을 가지고있는게아니라 브레인에서 제공하는식으로 서비스될까? 실제서비스는 어떻게 이루어질까! 현업가보고싶다.






© 2021. by ZooHo