1. Введение
DeepSeek снова удивляет.
20 октября 2025 года компания выпустила DeepSeek-OCR — новую модель с открытым исходным кодом для оптического распознавания символов (OCR).
В отличие от традиционных OCR-систем, которые читают символы последовательно, DeepSeek-OCR фактически смотрит на них.
Он использует механизм визуального сжатия токенов, сжимая документ из 1000 символов всего в 100 визуальных токенов с сохранением до 97% точности.