Кристина Ким говорит, что граница больше не в бенчмарках. Это использование.
Оценки Эвал насыщены, но повседневная жизнь — нет. Настоящий сигнал прогресса — это то, сколько людей используют ИИ для выполнения реальных задач.
Вот как мы узнаем, что приближаемся к ИИ.
Посмотреть ОригиналОценки Эвал насыщены, но повседневная жизнь — нет. Настоящий сигнал прогресса — это то, сколько людей используют ИИ для выполнения реальных задач.
Вот как мы узнаем, что приближаемся к ИИ.