Qwen3: 더 깊이 생각하고, 더 빠르게 행동하세요.

2025-04-29

Qwen3는 Qwen 대형 언어 모델 군의 최신 추가 모델로 출시됨.
Qwen3-235B-A22B은 DeepSeek-R1, o1, o3-mini, Grok-3, Gemini-2.5-Pro와 비교하여 높은 벤치마크 성능을 발휘함.
작은 MoE 모델인 Qwen3-30B-A3B는 QwQ-32B보다 뛰어난 성능을 보이며, Qwen3-4B 같은 작은 모델이 Qwen2.5-72B-Instruct와 경쟁 가능.
Apache 2.0 라이센스 하에 MoE 모델 Qwen3-235B-A22B 및 Qwen3-30B-A3B와 6개의 밀집모델을 공개.
Qwen3 모델은 GitHub, Hugging Face, ModelScope, Kaggle에서 사용 가능하며 SGLang 및 vLLM 등의 프레임워크를 통해 배포 가능.
사용자는 연구, 개발, 생산 환경에서 Qwen3에 쉽게 통합 가능.
Qwen3 모델은 문제 해결에 있어 하이브리드 모드(생각 모드와 비생각 모드)를 지원하여 유연한 접근 가능.
119개 언어와 방언을 지원하여 멀티링구얼(다언어) 지원 강화.
MCP 지원 강화 및 코드 및 에이전트 역량 최적화.
Qwen3 모델은 사전 훈련 데이터 확장 및 향상된 훈련 방법을 통해 뛰어난 성능을 발휘.
후원 및 강화 학습(API 개발 등)을 통해 사용자 활용 개선.
AGI와 ASI를 향한 여정에서 중요한 이정표로, 미래에는 여러 차원에서 모델 개선 의지.

5qwenlm.github.io링크 복사하기

AI 뉴스 요약은 뉴스의 내용을 AI가 요약(GPT-4 활용)한 것입니다. 따라서 틀린 내용을 포함할 수 있습니다. 뉴스의 자세한 내용을 확인하시려면 해당 뉴스 링크를 클릭해주세요.