Изследване на MIT разкрива, че големите езикови модели разсъждават по начин, подобен на човешкия мозък

Ново изследване на Масачузетския технологичен институт (MIT) разкри, че големите езикови модели (LLMs) обработват различни видове данни чрез централен механизъм, наподобяващ семантичния хъб на човешкия мозък. Това откритие дава ценни прозрения за начина, по който LLM интегрират информация от различни модалности – текст, изображения, аудио и други.

При хората предният темпорален лоб играе ключова роля в интегрирането на семантична информация от различни сензорни входове. Изследването показва, че LLM използват сходен централен механизъм, когато обработват различни езици, код или дори аритметични задачи.

Изследователите са доказали, че намесата в семантичния хъб на един модел чрез текст на доминиращия му език може да промени начина, по който той обработва данни дори на друг език. Това означава, че LLM имат универсален начин за интегриране на информацията, подобно на човешкия мозък.

Водещият автор Жаофенг Ву, докторант в катедрата по електроинженерство и компютърни науки в MIT, подчертава важността на разбирането на тези вътрешни механизми: “Големите езикови модели са като черни кутии – постигат впечатляващи резултати, но имаме малко знания за техните вътрешни механизми.”