검색
검색
AI news 검색
회원가입로그인

Alibaba, Qwen3, ‘하이브리드’ AI 추론 모델 가족 공개

  • 중국 기술 회사 알리바바가 최신 AI 모델 시리즈인 Qwen3를 공개함.
  • Qwen3는 구글과 OpenAI의 최고 모델들과 경쟁할 수 있고, 일부 경우에서는 능가할 수 있다고 주장.
  • 대부분의 모델은 AI 개발 플랫폼 Hugging Face와 GitHub에서 "오픈" 라이선스로 다운로드 가능.
  • 모델의 크기는 0.6억 파라미터에서 235억 파라미터까지 다양함.
  • 중국발 AI 모델 시리즈의 등장은 미국 연구소들에 더 발전된 AI 기술 개발 압박을 가함.
  • Qwen3는 119개 언어를 지원하며 약 36조 토큰 데이터셋으로 훈련됨.
  • Qwen3 모델들은 복잡한 문제를 해결할 수 있는 "하이브리드" 모델로 고안됨.
  • Qwen3-235B-A22B 모델은 코딩, 수학 등의 벤치마크 평가에서 경쟁적인 결과를 달성.
  • 가장 큰 Qwen3 모델, Qwen-3-235B-A22B는 일부 벤치마크 테스트에서 OpenAI의 모델을 능가.
  • Qwen3 모델은 클라우드 제공 업체 Fireworks AI와 Hyperbolic에서도 이용 가능.
  • Qwen3는 툴 호출 기능과 특정 데이터 형식 복사에서 뛰어난 성능을 보임.
  • Baseten의 CEO 투힌 스리바스타바는 Qwen3가 개방형 모델이 폐쇄형 시스템을 따라잡고 있는 증거 중 하나라고 언급.

5techcrunch.com링크 복사하기
AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.
원본 뉴스 보기