Екип от учени от MIT, MIT-IBM Watson AI Lab, Института Вайцман и други партньори представи нов метод, който позволява на генеративните AI модели точно да откриват персонализирани обекти — предмети, принадлежащи на конкретен човек или уникални за него. Това постижение решава дългогодишен проблем при визуално-езикови модели като GPT-5, които се справят отлично с разпознаване на общи категории (например „куче“), но често имат затруднения да идентифицират конкретни обекти, като едно определено куче сред много други.
Изследователите решават този проблем чрез специален тренировъчен процес, използващ видео данни, в които един и същ обект се проследява през множество кадри. Този набор от данни е създаден така, че моделът да трябва да разчита на контекстуални сигнали, за да открие и идентифицира персонализирания обект, вместо да се опира на запаметени визуални шаблони. В резултат, когато на модела бъдат показани само няколко примерни изображения на даден персонализиран обект — например нечий домашен любимец — той става значително по-добър в намирането на същия обект в напълно нови сцени.
Според екипа, моделите, обучени с този метод, надминават съществуващите най-съвременни системи, като запазват общите си способности за разбиране на визуална и езикова информация. Потенциалните приложения са широки — технологията може да позволи на AI системи да проследяват предмети като раница на дете, да разпознават конкретни животински видове в екологични проучвания или да подпомагат хора с увредено зрение при намирането на лични вещи.

 
				
			









 
				
			 
				
			 
				
			