Qwen3-Coder 教學:5分鐘學會使用阿里巴巴 Claude 等級的程式碼生成模型
大约 3 分鐘
Qwen3-Coder 教學:5分鐘學會使用阿里巴巴 Claude 等級的程式碼生成模型
尋找 Claude 4 的開源替代方案來輔助程式設計?這份逐步指南將幫助您快速上手 Qwen3-Coder。
🔍 什麼是 Qwen3-Coder?
Qwen3-Coder 是阿里巴巴開發的開源程式碼生成大語言模型,專為程式設計和工具使用(Agent)任務打造。它在多項基準測試中超越 GPT-4.1,並在實際編碼場景中 媲美 Claude 4。
主要特點:
- ✅ 支援高達 1M 上下文長度(原生支援 256K)
- ✅ MoE 架構:總參數 480B,僅 35B 活躍參數
- ✅ 70% 訓練數據專注於程式碼領域
- ✅ 頂尖的 Agent 能力
- ✅ 完全開源且可商用
🛠️ 安裝與部署
1. 本地運行(需 GPU)
我們使用 Qwen/Qwen3-Coder-7B-Instruct
進行單 GPU 設置。
安裝依賴
pip install transformers accelerate tiktoken
載入模型
from transformers import AutoTokenizer, AutoModelForCausalLM
model_name = "Qwen/Qwen3-Coder-7B-Instruct"
tokenizer = AutoTokenizer.from_pretrained(model_name, trust_remote_code=True)
model = AutoModelForCausalLM.from_pretrained(model_name, trust_remote_code=True).cuda()
基礎推理
prompt = "Write a Python quicksort function"
inputs = tokenizer(prompt, return_tensors="pt").to("cuda")
outputs = model.generate(**inputs, max_new_tokens=256)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))
2. 透過 API 使用(阿里雲)
阿里雲已開放 Qwen3-Coder 的 API 存取。
步驟:
登入阿里雲百煉平台
啟用 Qwen3-Coder
取得您的 API_KEY 和 API 端點
API 範例 (curl)
curl -X POST "https://api.aliyun.com/qwen3-coder" \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"prompt": "Create a JavaScript countdown timer",
"max_tokens": 300
}'
命令列工具:Qwen Code CLI
阿里巴巴還提供了一個配套 CLI 工具 — Qwen Code,專為 Agent 風格程式設計設計,只需單一指令即可生成專案級程式碼。
1. 安裝 CLI
pip install qwen-code
2. 透過提示詞生成程式碼
qwen-code "Create a user management system with registration using Flask"
這將自動生成完整的專案結構,包含程式碼和測試腳本。
示範:秒速建立品牌首頁
讓我們用實際提示詞測試它的 Agent 能力。
提示詞:
Create a brand homepage with a navigation bar, brand intro, product showcase, and contact section. Use HTML and CSS with responsive design.
輸出(節錄):
<!DOCTYPE html>
<html lang="en">
<head>
<meta charset="UTF-8">
<title>Brand Site</title>
<style>
body { font-family: Arial; margin: 0; padding: 0; }
header { background: #333; color: white; padding: 20px; text-align: center; }
...
</style>
</head>
<body>
<header><h1>Welcome to Our Brand</h1></header>
<section><h2>Products</h2>...</section>
...
</body>
</html>
在瀏覽器中打開這個檔案 — 瞬間獲得一個響應式品牌首頁!
Agent 能力
Qwen3-Coder 擅長處理長篇複雜的工具使用任務:
支援思維鏈推理 + 多工具工作流
相容 WebArena 和 BFCL 等工具使用環境
可與 LangChain、Flowise、Autogen 等整合
適用對象
使用者類型 | 使用範例 |
---|---|
程式設計新手 | 輔助撰寫、除錯和學習程式碼 |
獨立開發者 | 快速建置網頁應用、CLI 工具或微服務 |
AI 研究人員 | 進行程式碼相關 LLM 實驗的基準測試或微調 |
企業團隊 | 整合 API 提升生產力和程式碼審查效率 |