Человечество и Искусственный Интеллект: «Последний экзамен» не для машин

Почти тысяча ученых со всего мира разработала уникальный тест, названный «Последний экзамен человечества» (Humanity’s Last Exam). Включающий 2500 вопросов, он требует высоких экспертных знаний в сферах математики, биологии, физики и гуманитарных науках. Публикация в журнале Nature показала, что даже самые продвинутые языковые модели, такие как GPT-5 и Gemini 2.5 Pro, смогли ответить только на 25% вопросов.

Причина этого заключается в методах обучения ИИ. Нейросети, в первую очередь, подражают, извлекая информацию из обучающих данных и интернета. Однако «Последний экзамен» содержит вопросы, на которые нет прямых ответов. Они требуют логического мышления и применения знаний, например, перевода надписей на древних языках. Это показало, что за кажущимся интеллектом машин скрывается всего лишь огромный объем памяти.

После публикации теста разработчики ИИ активизировались, стремясь улучшить результаты своих моделей. Новые версии, такие как Gemini 3 Pro и GPT-5.2, уже показывают результаты на уровне 30-38%. Однако ученые предостерегают, что это не свидетельствует о реальном «умнении» машин, а лишь о том, что они «зазубрили» новый формат задач. Разработчики теста советуют не слишком полагаться на высокие результаты в бенчмарках, подчеркивая, что до гибкого человеческого разума машинам все еще далеко.

Помогите проекту, поделитесь с друзьями ;)

Добавить комментарий