Introducción
Recientemente, he estado explorando modelos de lenguaje grandes (LLMs) y me encontré con Moonshot AI, una empresa que realmente captó mi atención. Su modelo estrella, Kimi K2, afirma manejar hasta 128K tokens de contexto y utiliza una arquitectura de vanguardia llamada Mixture of Experts (MoE).
Alrededor de 4 min