Онтотекст: Търговският регистър е добре

„Да хакнем Търговския регистър“ – това заглавие се завъртя в медиите преди няколко дни във връзка с първото за Централна и Източна Европа практическо предизвикателство за обработка и анализ на данни Datathon, в което българската софтуерна компания Онтотекст ще помогне на екипи да представят силата на свързаните отворени данни.

Освен интерес към събитието, заглавието предизвика и известни притеснения. А някои читатели са видяли в него заплаха за българския Търговския регистър. В тази връзка бързаме да успокоим всички: Търговският регистър е добре, неговите системи за сигурност работят ефективно и той не е заплашен по никакъв начин.

Малко повече за понятията хаквам и хакер

Думата „хаквам“ може да означава много неща. Макар и през последните години за мнозина тя да носи негативното значение, свързано с непозволено проникване в компютърна система, все пак ще припомним, че още със своето възникване тя е натоварена по-скоро с позитивното значение – „измислям работещо решение“. И макар в медиите хакерите да са придобили популярност по-скоро като хора, извършващи компютърни престъпления, все още в технологичните среди по-често това понятие се използва по-скоро в позитивен контекст на някой, който открива нови начини за извършването на дадена задача.

За „хакването“ на Търговския регистър

Държим да уверим загрижените граждани, че Онтотекст използва думата изцяло в позитивното й значение. Целта на задачата, поставена от Онтотекст в предстоящия днес Datathon 2017, е преобразуването на данни от търговския регистър във формат, удобен да се използва за свързване на отворени данни (Linked Open Data).

По този начин, с използването на графови бази от данни, ще могат да се разкрият взаимовръзки и да се изведат скрити факти от данните, като например:

– идентифициране и класификация най-големите групи от свързани фирми в България или в определен район.

– board-walk: анализиране как съвместното участие на директори в бордове на различни фирми се отразява на сферите им на влияние.

В този смисъл “хакване” за нас има смисъл на “намиране на по-ефективно решение”. Нещо повече – участието на Онтотекст в Datathon събитието се извършва в пълна координация с Агенцията по вписванията. То няма да засегне по никакъв начин реалното функциониране на Търговския регистър, а ще спомогне за създаването на нови модели, които да подобрят функционирането му в бъдеще.

Задачата на Онтотекст

Задачата на Онтотекст ще покаже как един голям набор от изключително сложни данни (тези на Търговския регистър), които в момента са организирани като набор от ежедневни актуализации в XML файлове – могат да бъдат агрегирани и превърнати в LOD формат, който да е достъпен, отворен (основан на отворени стандарти и препоръки от W3C) и свързан (връзки между фирми, управители, собственици, адреси и населени места).

За събитието

Dathaton Bulgaria ще се проведе между 24 март и 26 и ще награди отборите, стигнали до най-прецизно, креативно и елегантно решение на проблемите, свързани с обработка и анализ на данни.