Evaluations — это инструмент ИИ для оценки моделей машинного обучения с несколькими модальными функциями, включая отслеживание сущностей, оценку логических рассуждений и ответы на вопросы в реальном мире. Он поддерживает пользовательские сеансы, задачи визуального рассуждения и сравнения моделей в структурированной среде.