За рубежами

Apple выявила дефекты популярных языковых моделей в области логического мышления

15.10.2024

362

Проведённое Apple исследование ведущих языковых моделей – от OpenAI, экстремистской Meta и других компаний — выявило неспособность искусственного интеллекта (ИИ) «мыслить логически», написал в понедельник macrumors.com.

Apple заостряет внимание на сохраняющейся проблеме языковых моделей – они зависимы от сформированных при обучении шаблонов, предлагаемые ими ответы не есть плод логических рассуждений. Во время тестов исследователи показали, что добавление малозначимой информации к вопросу — деталей, которые не должны влиять на результат – может обусловить выдачу сильно различающихся ответов от моделей.

Например, когда моделям задали задачу посчитать, сколько человек собрал киви за несколько дней и добавили данные о размере нескольких фруктов, модели OpenAI и Meta дали неверный ответ.

Эксперимент

Редакция D-Russia.ru поставила свой эксперимент и пришла к тем же результатам, что и Apple. Экспериментировали мы с GPT4-4o mini. На запрос «у буратино 2 яблока, не дам некту яблоко, хоть он дерись. сказал буратино – сколько яблок будет у некты, если он подерётся с буратино?» получен ответ: «Если у Буратино 2 яблока и он не собирается давать одно из них Некте, то даже если они подерутся, у Некты всё равно не будет яблок. Таким образом, после драки у Некты останется 0 яблок.»

В этом ответе лишь видимость логики. GPT4-4o mini неизвестен исход драки Некто с Буратино – это не оговаривается условием задачи, однако очевидно, что яблоко достанется победителю. Однако робот почему-то безоговорочно верит Буратино.

См. также: Как ChatGPT использовали для написания новости — результат >>>

Чтобы не пропустить самое интересное, читайте нас в Телеграм

Экспертный центр электронного государства не будет проводить в 2026 году конкурс…

Опубликованы материалы форума «ПРОФ-IT.2025»

Лучшие практики и новые тренды цифрового развития регионов: итоги XIII форума…

Заместитель губернатора — директор департамента IT и связи ЯНАО Константин Оболтин…

Победители ещё пяти номинаций определены на Всероссийском конкурсе цифрового развития регионов…

Apple выявила дефекты популярных языковых моделей в области логического мышления

Поделиться:

Новости

Центробанк запланировал расширение сервисов цифрового рубля

ИИ-помощник от Microsoft получил несанкционированный доступ к почте пользователей

Росреестр представил на Кубе опыт использования ИИ

Германия потребовала от американской компании отчёта о выборах в Венгрии

Стартап из Татарстана создал «первую в мире» технологию маркировки воздушного пространства...

Эксперты

IT-индустрия против депутатов: безнадёжность

О некоторых итогах цифровой трансформации Оренбургской области в 2025 году

Нет ERP в своём отечестве, или Полумера

Минцифры Татарстана: итоги работы в 2025 году

Почему важно выбирать отечественное решение для управления парком корпоративных устройств