본문 바로가기
인공지능

[인공지능] 하늘에서 모델이 비처럼 쏟아져". 메타의 '라마 3.1'에 이어 미스트랄 AI의 '라지 2' 잇달아 출시

by 오션지키미 2024. 7. 28.
320x100
반응형

메타의 '라마 3.1'에 이어 미스트랄 AI의 '라지 2'가 이번 주 잇달아 출시됐습니다. 지난주 오픈AI의 'GPT-4 미니'까지 합치면 일주일 새 주요 모델 3개가 등장한 셈입니다. 이를 두고 미국 매체는 "하늘에서 비처럼 모델이 쏟아진다"라는 표현도 사용했습니다.


올해 들어 주요 대형언어모델(LLM)의 출시가 부쩍 늘어난 느낌입니다. 업데이트 주기도 훨씬 빨라진 느낌입니다. 그래서 다시 정리해 봤습니다.

우선 가장 먼저 주목받은 모델은 지난 2월 출시된 구글의 '제미나이 1.0 울트라'입니다. 구글은 지난해 12월 프로와 나노 등 작은 모델 2가지를 먼저 공개하고, 이어 울트라를 내놓았습니다. 그러나 모델 자체보다는 '바드'라는 챗봇 이름을 '제미나이'로 변경한 데 더 관심이 맞춰졌습니다. 하지만 며칠 뒤 공개한 '제미나이 1.5 프로'는 현재 구글의 간판 모델로 자리 잡았습니다.

또 5월 개발자회의에서는 '제미나이 1.5 플래시'라는 업그레이드 버전을 출시했는데, 이 또한 'AI 개요'와 '프로젝트 아스트라'에 가린 모습입니다.

가장 눈길을 모았던 모델은 앤트로픽의 '클로드 3'일 것입니다. 지난 3월 출시 직후 오픈AI의 'GPT-4' 성능을 넘어 세계 최고 모델로 강한 인상을 남겼습니다. 자신을 테스트하려는 의도까지 알아차렸다는 에피소드는 유명합니다.

이때부터 오픈AI와 본격적인 최고 성능 경쟁을 펼칩니다. 이어 6월에는 '클로드 3.5 소네트'로 다시 한발 앞서 나갔습니다.

오픈AI는 지난해 11월 'GPT-4 터보'를 내놓은 뒤 올해 'GPT-5' 출시에 앞서 파운데이션급 모델은 딱 하나, 'GPT-4o'만 내놓았습니다.

하지만 AI 음성 비서 시대를 예고했다는 점과 스칼렛 요한슨 목소리 도용 문제로 강한 인상을 남겼습니다. 이 외에는 2월에 출시한 동영상 생성 모델 '소라'가 LLM 못지않은 파괴력을 선보였습니다.

오픈 소스 진영에서는 역시 최근 공개한 메타의 '라마 3.1'이 대표적입니다. 특히 오픈 소스도 폐쇄형과 어깨를 견줄 정도로 성능이 좋아졌다는 것에 초점이 맞춰졌습니다. 3개월 전에는 '라마 3' 중형 및 소형 모델을 먼저 출시했습니다.

프랑스의 간판 미스트랄 AI도 빼놓을 수 없습니다. 지난주 발표한 라지 2 이외에도 연초 '믹스트랄 8x7B'와 '8x22B'로 오픈 소스의 최강자 대열에 합류했습니다.

마지막으로 일론 머스크의 xAI도 주목할 만합니다. 지난 3월 '그록-1'을 오픈 소스로 공개한 것을 시작으로, '그록-1.5'와 멀티모달모델 '그록-1.5v'까지 발표했습니다.

특히 조만간 '그록-2'에 이어 내년 초 세계 최고 수준이라는 '그록-3'를 출시할 것으로 알려졌습니다. 이를 훈련하기 위해 천문학적 비용을 들여 데이터 센터까지 건설했습니다.

이 밖에도 기업용 LLM 전문인 코히어는 4월 '코맨드-R+'라는 플래그십 모델을 출시했고, 알리바바의 '큐원 2' 등 오픈 소스 모델도 관심을 끌었습니다. 데이터브릭스나 스노우플레이크 등 데이터 전문 기업도 중요 모델을 선보였습니다.


이렇게 따지면 1~7월 공개된 주요 모델은 20여개에 달합니다. 이는 지난해 전체 공개된 주요 모델의 2배를 벌써 넘어섭니다.

게다가 후반기에는 'GPT-5'와 '클로드 3.5 오퍼스'는 물론, '역대 최대 매개변수'로 알려졌던 아마존의 LLM, 메타의 멀티모달모델 등이 출시 대기 중입니다.

최고 성능 모델 타이틀도 계속 경신될 가능성이 큽니다. 그리고 결국에는 모델 출시가 줄어들 것으로 예상됩니다. 모델 개발을 위한 인프라 구축이 이제는 '넘사벽' 수준으로 커졌기 때문입니다.



이런저런 이유로 2024년은 '모델의 해'로 기억될 것이 분명합니다. 아니, '모델을 다 기억하기도 어려웠던 해'라는 표현이 정확할 것 같습니다.

728x90
반응형