1. 簡介
DeepSeek 再次突破極限。
在 2025 年 10 月 20 日,該公司發布了 DeepSeek-OCR,這是一款全新的開源光學字元辨識(OCR)模型。
與傳統 OCR 系統逐字讀取不同,DeepSeek-OCR 真正看見文字。
它引入了視覺標記壓縮機制 —— 將 1000 個字元的文件壓縮成僅 100 個視覺標記,同時保持高達 97% 的準確率。
原創大约 5 分鐘
DeepSeek 再次突破極限。
在 2025 年 10 月 20 日,該公司發布了 DeepSeek-OCR,這是一款全新的開源光學字元辨識(OCR)模型。
與傳統 OCR 系統逐字讀取不同,DeepSeek-OCR 真正看見文字。
它引入了視覺標記壓縮機制 —— 將 1000 個字元的文件壓縮成僅 100 個視覺標記,同時保持高達 97% 的準確率。
如果你對多模態AI或視覺語言模型感興趣,可能聽說過Flux Kontext Pro——這是一個在英語為主的圖像理解任務中表現穩定的模型。
但現在,阿里巴巴推出的新模型Qwen Image正在改變遊戲規則——特別是針對中文內容。根據我們的實際測試,我們可以自信地說:
👉 Qwen Image在多語言和真實場景中的準確性、上下文感知和整體可用性方面都優於Flux Kontext Pro。
