중기이코노미

중견·중소기업 소상공인 매체
2024/06/17(월) 00:00 편집
스마트복지포털

주요메뉴

등기데이터2
메일 페이스북 트위터 프린트
기술미래HIT! 이 기술

챗GPT 잡는다?…메타, AI시장 판도를 바꿀까

“누구나 AI 만들도록 하겠다”…메타 언어모델 무료 공개 영향은 

기사입력2023-07-18 00:00

현재 글로벌 시장에서 생성형AI 시장을 주도하는 기업은 오픈AI와 MS, 구글이다하지만 AI 산업의 발전 가능성이 높은 만큼이 시장을 확보하기 위한 다른 기업들의 움직임도 활발하다특히 최근에는 메타(구 페이스북)가 AI 시장의 판도를 뒤집기 위해 새로운 전략을 꺼내 이목이 집중된다메타가 내놓은 전략은 무엇이고, AI 생태계에는 어떤 영향을 미칠까.

 

지난 2월 메타는 자사의 대규모 언어모델(LLM) ‘라마(LLaMA)’를 공개하고, 연구개발 목적이라면 누구나 라마를 사용할 수 있도록 오픈했다. 이에 학계와 시민단체 등에서 주로 라마를 사용했다. 그런데 지난 620, 메타는 기존의 방침에서 더 나아가 다소 파격적인 선언을 했다. 라마를 업그레이드해 상업용으로 선보인다고 발표한 것이다. 상업용 라마의 공개 시점은 현재 정해지지는 않았지만, 올해 안에 개방될 것으로 예상된다.

 

언어모델(LLM)이 중요한 이유는 무엇=메타의 전략과 AI를 이해하려면 먼저 대규모 언어모델이 무엇인지 이해할 필요가 있다. 우리가 로봇을 편리하게 이용하려면, 로봇이 인간처럼 글을 읽고 쓰고 인간과 소통할 수 있도록 만들어야 한다. 그래서 나온 것이 대규모 언어모델이다.

 

대규모 언어모델(LLM, Large Language Model)이란 방대한 양의 텍스트 데이터를 학습한 일종의 인공지능(AI) 모델로, 문장을 이해하고 새로운 문장을 생성하는 능력을 갖춘 것이 특징이다.

 

우리가 챗GPT나 바드 등의 생성형AI에게 이메일을 써줘”, “이 문장을 영어로 번역해줘AI에게 질문을 하면 AI는 척척 답을 내놓는다. 이처럼 생성형AI가 텍스트로 대답을 하려면 대규모 언어모델이 기반이 되어야 한다. 대규모 언어모델은 생성형AI의 성능을 좌우하기도 한다. 더 많은 데이터를 학습하고 보다 양질의 데이터에 기반한 대규모 언어모델일수록, 생성형AI도 인간의 말을 더욱 잘 알아듣고 양질의 답을 제시할 수 있다.

 

오픈소스 전략으로 생태계 확장 노려=현재 생성형AI로 시장을 선점한 오픈AIMS, 구글은 제각각 대규모 언어모델(LLM)을 보유하고 있다. 하지만 이와 관련된 정보는 대부분 공개하지 않는 등 폐쇄적인 정책을 취하거나 유료로 사용할 수 있도록 제한하고 있다. 오픈AI는 지난 3월 발표한 대규모 언어모델인 ‘GPT-4’의 구체적인 기술을 거의 공개하지 않았다. 구글 또한 새로운 대규모 언어모델인 2(PaLM2)’를 선보이면서도 중요한 정보는 비공개했다.

 

반면, 메타의 전략은 이들 기업과는 정반대다. 메타는 자사의 대규모 언어모델을 오픈소스로 내놓으며, 상업적으로도 사용할 수 있도록 하겠다고 밝혔기 때문이다. 오픈소스란 소프트웨어나 다른 작업물을 만드는 데 사용되는 소스 코드를 공개해, 누구나 사용할 수 있도록 개방하는 것을 뜻한다. 이렇게 하면 많은 개발자들이 개발에 참여하고 상호협력할 수 있어 생태계 형성이 촉진되며, 다양한 혁신과 기회가 만들어질 수 있다. AI 산업이 발전하려면 사용자들이 AI를 경험하는 것도 중요하지만, 개발자들도 자신만의 아이디어로 자유롭게 AI를 만들 기회가 주어져야 한다. 이번 메타의 전략은 AI 개발시장에 큰 영향을 줄 것으로 보인다.

 

대규모 언어모델을 무료로 공개하는 전략은 메타 입장에서도 이득이 될 수 있다. 메타로 하여금 AI가 다양하게 만들어지고 업계에 생태계가 형성된다면, 메타는 AI 시장을 주도하고 다양한 사업을 펼칠 수 있으며 다양한 개발자들과 함께 기술력을 고도화할 수 있다. 현재 글로벌 시장에서는 오픈AI, MS, 구글이 생성형AI 시장을 주도하고 있으며 메타는 후발주자다. 이러한 시장에서 앞서간 기업들과 똑같은 전략을 취하기보다는 무료로 공개하는 것이 그나마 승산이 될 수 있다. 이러한 전략이 효과적이라면 기존의 AI 시장 일부를 메타의 것으로도 가져올 수 있다.

 

메타는 자사의 대규모 언어모델을 오픈소스로 내놓으며, 상업적으로도 사용할 수 있도록 하겠다고 밝혔다. 이렇게 하면 많은 개발자들이 개발에 참여하고 상호협력할 수 있어 생태계 형성이 촉진되며, 다양한 혁신과 기회가 만들어질 수 있다. 이번 메타의 전략은 AI 개발시장에 큰 영향을 줄 것으로 보인다. <이미지=이미지투데이>

 

메타 언어모델, 크기는 작지만 가벼워=메타의 대규모 언어모델은 오픈AI나 구글보다는 크기가 작다. AI의 성능과 작동방식에 큰 영향을 미치는 일종의 단위를 파라미터(매개변수)’라고 한다. 파라미터가 클수록 AI 모델의 크기도 더 커지고 더 복잡한 요소를 학습할 수 있어 성능이 뛰어나다. 메타의 라마는 파라미터가 70억개다. 반면 구글의 팜2는 파라미터가 5400억개이며, 오픈AIGPT-3.5의 파라미터는 1750억개다. GPT-4 파라미터는 공개되지는 않았지만 5000억개 이내로 추정된다. 이처럼 경쟁사와 비교하면 메타의 파라미터 개수는 현저히 적다.

 

파라미터 개수가 적으면 단점만 있을까? 오히려 매개변수가 작기 때문에 따르는 이점도 있다. 메타의 대규모 언어모델은 슈퍼컴퓨팅 없이 PC에서도 AI 모델을 구동할 수 있다. 보통 대규모 언어모델은 슈퍼컴퓨팅이 필요한데, 메타의 대규모 언어모델은 그럴 필요가 없기 때문에 부담을 덜 수 있다.

 

AI 서비스하고 싶은 기업에 희소식 될까=생성형AI를 둘러싼 경쟁이 치열해지면서, 생성형AI의 기반이 되는 대규모 언어모델을 둘러싼 경쟁 역시 치열해지는 것으로 보인다. 오픈AI와 구글은 이미 시장에서 선두를 잡은 만큼 대규모 언어모델을 무료로 공개할 필요가 없지만, 이들을 추격해야 하는 입장에 놓인 메타는 오픈소스로 사활을 걸 것으로 보인다. 물론 메타가 이에 드는 비용을 어떻게, 언제까지 부담할 수 있을지는 추이를 지켜봐야 하겠지만, AI 산업 전반을 놓고 보면 새로운 기회가 될 것으로 보인다.

 

물론 대규모 언어모델을 오픈소스로 개방한 기업은 메타가 처음은 아니다. 지난 6월 클라우드 기반 데이터 플랫폼 기업인 데이터브릭스가 인수한다고 밝힌 생성형AI 스타트업인 모자이크ML’이다. 모자이크ML은 자체 개발한 대규모 언어모델 ‘MPT’를 보유하고 있으며, ‘MPT-7B’를 오픈소스로 공개한 바 있다. 모자이크ML은 자사의 언어모델을 이용해 여러 기업들이 AI 챗봇 등을 자체적으로 구축하도록 지원하고 있다.

 

이처럼 메타와 모자이크ML와 같이 대규모 언어모델을 오픈소스로 개방하는 것은 AI를 개발·서비스하고 싶은 중소기업과 스타트업·개발자에게 큰 영향을 줄 것으로 보인다. GPT를 비롯한 생성형AI가 각광받자 AI를 개발해서 활용하고자 하는 수요 역시 늘어났는데, 생성형AI를 만들기 위해서는 그 기반이 되는 대규모 언어모델이 반드시 필요하다. 하지만 일반 기업에서 처음부터 대규모 언어모델을 구축하기란 기술적·비용적 측면에서 매우 어렵다. 대규모 언어모델을 직접 만들기보다는, 이미 개발되어 성능을 검증받은 대규모 언어모델을 활용하는 것이 보다 현실적이다. 그런데 이 대규모 언어모델을 오픈소스로 개방하는 곳이 있다면 AI 개발의 문턱 역시 낮아질 수 있다.

 

대규모 언어모델의 공개는 보다 많은 이들이 AI 개발에 나서고, 사회 전반에서 AI를 더 많이 활용하도록 견인할 것으로 예상된다. 이를 통해 만들어지는 AI가 사회 곳곳에서 유익한 뱡항으로 쓰이길 희망한다. 중기이코노미 안수영 기자

<저작권자 ⓒ 중기이코노미. 무단전재 및 재배포 금지>

목록 top
스마트에듀센터

객원전문 기자칼럼

 
  • 부동산법
  • 상가법
  • 준법길잡이
  • IP 법정
  • 생활세무
  • 판례리뷰
  • 인사급여
  • 노동정책
  • 노동법
  • 인사노무
  • 민생희망
  • 무역실무
  • 금융경제
  • 부동산
  • 가맹거래
  • 기업법률
  • CSR·ESG
  • 예술만세
  • 작가노트
  • 예술별자리
  • 세상이야기
  • 빌딩이야기
이전 다음