Esta web se ha convertido en una especie de ranking de referencia de lenguajes LLM (modelos gigantes de inteligencia artificial que se utilizan para realizar tareas relacionadas con el procesamiento del lenguaje natural). En ella puedes poner a "luchar" a dos sistemas aleatorios diferentes iniciando una conversación simultánea con ambos.
Al fin puedes valorar que conversación es la mejor y, mediante un sistema Elo, se acaba creando un ranking LLM.
Comentarios
Ojito que GPT-4 ya no es el tipo mas duro de la ciudad, tenemos nuevo rey: Claude 3 Opus.
Por desgracia, Claude sigue sin estar disponible en España. 😫