Meta는 최신이자 가장 진보된 오픈소스 인공지능 모델인 Llama 3.1의 출시를 발표했습니다. 이 새로운 버전은 AI 기술에 있어서 상당한 도약을 나타내며, Meta는 OpenAI와 같은 회사의 선도적인 독점 모델보다 성능이 뛰어나다고 주장합니다.
4,050억 개의 매개변수를 특징으로 하는 플래그십 Llama 3.1 405B 모델은 현재 가장 큰 공개 기반 모델입니다. 이 모델은 일반 지식, 수학, 도구 사용 및 다국어 번역에서 최첨단 기능을 보여줍니다. 이 모델은 16,000개가 넘는 Nvidia H100 GPU를 사용하여 15조 개가 넘는 토큰에서 학습되었습니다.
Llama 3.1의 주요 개선 사항 중 하나는 128K 토큰의 확장된 컨텍스트 길이로, 이는 이전 Llama 모델의 용량의 16배입니다. 이를 통해 AI는 훨씬 더 긴 텍스트 구절을 처리하고 이해할 수 있어 복잡한 작업을 처리하고 보다 미묘한 응답을 생성하는 능력이 향상됩니다.
새로운 모델은 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어 등 8개 언어를 지원합니다. 이러한 다국어 기능은 Llama 3.1을 글로벌 AI 애플리케이션을 작업하는 개발자와 기업을 위한 다재다능한 도구로 만듭니다.
Meta는 Llama 3.1을 405B , 70B , 8B 매개변수의 세 가지 크기로 출시합니다. 각 크기는 다양한 사용 사례에 맞게 최적화되었습니다.
- 405B 모델은 장문 텍스트 생성, 다국어 번역, 코딩 및 복잡한 추론 작업이 가능하여 엔터프라이즈 애플리케이션과 고급 연구에 이상적입니다.
- 70B 모델은 콘텐츠 생성, 대화형 AI, 언어 이해에 적합합니다.
- 8B 모델은 모바일 기기와 같이 계산 리소스가 제한적인 애플리케이션을 위해 설계되었습니다.
채택을 용이하게 하기 위해 Meta는 Amazon, Google, Databricks와 같은 주요 기술 회사와 협력하여 Llama 3.1을 다양한 플랫폼에서 사용할 수 있도록 하고 있습니다. 예를 들어, 이 모델은 이제 Amazon SageMaker JumpStart 및 Amazon Bedrock과 같은 서비스를 통해 Amazon Web Services(AWS)에서 액세스할 수 있습니다.
Meta의 CEO인 마크 주커버그는 오픈소스 AI의 중요성을 강조하며, AI 혜택을 민주화하는 데 중요하다고 말했습니다. 그는 Llama 3.1과 같은 오픈소스 모델이 결국 기능과 채택률 면에서 독점 모델을 능가할 것이라고 믿습니다.
Llama 3.1 출시에는 개발자가 모델의 출력을 사용하여 다른 AI 시스템을 개선할 수 있는 업데이트된 라이선스도 함께 제공됩니다. 이러한 움직임은 AI 분야의 혁신을 가속화하고 개발자에게 AI 애플리케이션을 빌드하고 사용자 정의하는 데 더 많은 유연성을 제공할 것으로 예상됩니다.
오픈소스 AI에 대한 Meta의 헌신은 Linux가 많은 기기와 서버에서 지배적인 오픈소스 운영 체제가 된 방식을 연상시킵니다. 이 회사는 Llama 3.1이 마찬가지로 AI 개발의 초석이 되기를 바라고 있습니다.
AI가 계속해서 빠르게 진화함에 따라 Llama 3.1의 출시는 강력한 AI 모델을 전 세계의 개발자와 기업이 더 쉽게 이용할 수 있도록 하는 데 있어 중요한 이정표를 세웠습니다. 이는 오픈소스 모델이 독점 모델과 직접 경쟁하고 잠재적으로 이를 능가하는 새로운 시대의 AI 혁신을 위한 무대를 마련합니다.
답글 남기기