阿里巴巴推出新人工智慧模型 QwQ-32B 力抗 OpenAI

阿里巴巴發布了一款新型人工智能（AI）模型 QwQ-32B，該模型的推理能力被認為能與 OpenAI 的 GPT-o1 系列模型相抗衡。這款大型語言模型（LLM）目前處於預覽階段，據稱在數學和邏輯推理相關的基準測試中超越了 GPT-o1-preview。儘管 QwQ-32B 已可在 Hugging Face 上下載，但它並未完全開源。

QwQ-32B 的特點

在官方部落格中，阿里巴巴詳細介紹了 QwQ-32B 的能力與限制。該模型基於 320 億個參數，擁有 32,000 個 token 的上下文窗口，並已完成預訓練和後訓練階段。其架構基於變壓器技術，並使用了旋轉位置嵌入（RoPE）、開關門線性單元（SwiGLU）、均方根正規化（RMSNorm）功能，以及注意力查詢-鍵-值偏差（Attention QKV）等技術。

內部推理過程

QwQ-32B 在評估用戶查詢時會顯示其內部思維過程，這種內部獨白的方式使其能夠測試各種理論並自我驗證，從而提供更準確的答案。在內部測試中，阿里巴巴聲稱該模型在 MATH-500 基準上獲得了 90.6% 的分數，而在 AI 數學評估（AIME）基準上則達到了 50%，超越了 OpenAI 的推理專注模型。

推理能力的局限性

值得注意的是，推理能力更強的 AI 模型並不意味著它們具備更高的智慧或能力。這是一種新的方法，稱為測試時計算（test-time compute），允許模型在處理任務時花費更多的計算時間。因此，AI 能夠提供更精確的回應並解決更複雜的問題。不過業內專家指出，新的 LLM 在進步速度上並未如舊版本般顯著，顯示現有架構已達飽和點。

儘管 QwQ-32B 在查詢上花費額外的處理時間，但它仍存在一些限制。阿里巴巴表示，該模型有時會混合語言或在語言之間切換，導致語言混合和代碼切換等問題。此外，該模型還可能進入推理循環，除了數學和推理技能外，其他領域仍需改進。

阿里巴巴的 QwQ-32B 模型的推出標誌著中國在 AI 領域的進一步發展，尤其是在推理能力方面的競爭。儘管仍有一些挑戰和限制，但這一新技術無疑將對未來的 AI 應用產生深遠影響。

Alibaba
Mall HK