Българската компания за семантичен софтуер Онтотекст АД приключи работата си по европейския проект PHEME „Изчисляване на истинността в медиите, езиците и социалните мрежи“ (Computing Veracity Across Media, Languages, and Social Networks). Припомняме, че проектът, който е наречен на древногръцката богиня на слуховете и мълвите Pheme, започна на 1 януари 2014 година. Участниците в него си поставиха за цел създаването на интелигентни методи и приложения за удостоверяване истинността на информацията в медиите и социалните мрежи, както и за предупреждаване на потребителите, когато е на лице слух или невярна информация.
За тази цел в рамките на PHEME са създадени т.нар. смислови единици „феми“ (phemes) – интернет меми (memes), към които е добавена стойност истинност или лъжа. Проектът се фокусира именно върху моделирането, идентифицирането и верифицирането на такива феми в различни информационни канали.
Онтотекст взе участие в проекта със своята експертиза и опит в сферата на семантичните технологии, създавайки алгоритми за засичане и класифициране на слуховете и превръщайки тези технологии в практически приложения, които могат да бъдат използвани от дигиталните журналисти и други потребители на информация. Придобитите и обогатените данни от различните компоненти, разработени в рамките на проекта, са включени в своеобразно Хранилище на знания (Knowledge repository), създадено чрез семантичната графова база GraphDB на Онтотекст. Тя от години се използва от водещи международни медийни групи като BBC, Press Association, Euromoney и The Financial Times, научните издателства Springer Nature и IET, корпорации като AstraZeneca и Raytheon, както и институции като Националния архив на Великобритания и The British Museum.
Работата на Онтотекст по проекта обаче не се свежда само до внедряването на GraphDB. Използвайки опита си в сферата на текстовия анализ, българският екип е предоставил също ценни концепции за извличане и обогатяване на информация и за свързването на хора, организации и местоположения от непроверени канали в социалните медии с обогатената контекстуална информация за тях. Това в крайна сметка спомага за разпознаване истинността й. Онтотекст е изиграла активна роля и в превръщането на технологиите, създадени в рамките на проекта, в практични приложения, които могат да бъдат използвани от дигиталните журналисти. Разработен е и прототип на платформа с отворен код, който демонстрира възможностите на технологиите и има за цел да подпомогне журналистите при събирането на новини и тяхното верифициране.
Освен това Онтотекст е създала заедно с останалите партньори по проекта и дигиталния асистент за проверка на факти Hercule. Той представлява уеб базиран интерфейс, който помага на журналистите да изследват новини, видео и съдържание в социалните мрежи, съответстващо на дадена тема, да го филтрират и анализират визуално по време, степен на влияние, противоречивост, източник и други показатели, както и да валидират различни твърдения. Функционалностите на Hercule включват също извличане, семантично обогатяване и индексиране на структурирани твърдения, тяхното свързване с различни отворени и публични масиви от данни, както и с други информационни архиви.
Повече информация за проекта PHEME е достъпна на: https://www.pheme.eu/
А повече информация за семантичната база GraphDB – на: https://ontotext.com/products/graphdb/