
Изследване на INSAIT разкрива, че популярните GPT модели са склонни да „решават“ грешни математически задачи
Екип от INSAIT, институт към Софийския университет „Св. Климент Охридски“ и ETH Цюрих представи BrokenMath — първия в света сравнителен тест, който системно оценява склонността на големите езикови модели (LLMs) към сляпо съгласие (sycophancy) при решаване и доказване на математически твърдения. BrokenMath разкрива важен недостатък на съвременните модели за изкуствен интелект: те често уверено се…