Follow the money: Bihus.Info інтегрували 3 українські бази даних до міжнародного сервісу для викривачів від OCCRP

Антикорупційники Bihus.Info розпочали обмін даними з Проектом розслідування корупції та організованої злочинності (OCCRP). В рамках співпраці вже 3 українські датасети на 4,5 мільйони унікальних записів доступні для викривачів з усього світу в міжнародному сервісі Aleph.
Follow the money: Bihus.Info інтегрували 3 українські бази даних до міжнародного сервісу для викривачів від OCCRP

Переможці в закупівлях, донори політичних партій і податкові борги - з цими трьома українськими датасетами відтепер можуть працювати журналісти з усього світу в сервісі Aleph. Це стало можливим завдяки співпраці головного IT-спеціаліста Bihus.Info і співзасновника “Канцелярської сотні” Дмитра Чаплинського з Проектом розслідування корупції та організованої злочинності (OCCRP).

“Сервіс Aleph від OCCRP — потужний програмний комплекс для журналістів, активістів, правоохоронних органів та фінансових розвідок, що об'єднує в собі майже три сотні наборів відкритих даних, зібраних зі всього світу, - розповідає Дмитро Чаплинський, розробник ресурсів “Декларації”, “Ring”, “Посіпаки”, “Посіпаки-2”. - Поєднання їх під "одним дахом" та потужні алгоритми пошуку, матчингу та візуалізації дозволяє ефективно працювати над транскордонними розслідуваннями”.

Команда OCCRP збирає та накопичує архіви новин, реєстри компаній, витоки (наприклад, Panama Papers), дані про закупівлі з 233 країн. За словами Дмитра, важливість проєкту полягає в тому, що Аleph пропонує модель даних followthemoney, для того щоб структурувати інформацію, розкладаючи документи, записи в реєстрах в набір сутностей та відношень між ними (наприклад, компанія, персона, транзакція, контракт, тощо). Це допомагає зводити дані геть різної природи в єдину систему знань та зв'язків.

“В свою чергу, ми в проєкті ring.org.ua створили пошуковий ресурс та банк даних використовуючи інформацію, що були зібрані командою Bihus.Info, інструментами Канцелярської сотні, а також державні дані (як відкриті, так й ті, що держава оприлюднила в будь-який спосіб, а ми витягли та обробили). Наразі ring.org.ua об'єднує 19 джерел та майже 16 мільйонів записів. Саме тому ми вирішили долучитися до проєкту Aleph, та почали підготовку та трансформацію наших даних у формат followthemoney, тож хлопцям та дівчатам з OCCRP залишилося тільки імпортувати їх до загального сховища”, - зазначив Дмитро.

У такий спосіб Bihus.Info вже оприлюднили 3 датасети (переможці в закупівлях, податковий борг та донори політичних партій). Загальна кількість унікальних сутностей при цьому становить майже 4.5 мільйони (це пов'язано з тим, що один запис про закупівлю містить декілька сутностей — замовник, підрядник, представник замовника, договір, тощо). Розробники також зробили все можливе, щоб полегшити пошук цих даних іншими мовами використовуючи наші напрацювання в транслітеруванні імен та перекладах.

Завдяки цьому користувачі Аleph зі всього світу отримали прямий доступ до інформації, що стане додатковою цеглинкою в їх дослідженнях та розслідуваннях. В свою чергу для Bihus.Info це можливість автоматизувати деякі інструменти ризик-аналізу та автоматичного дослідження зв'язків.

Керівник проєкту Aleph і Data Team Lead в OCCRP Фрідріх Лінденберг подякував Дмитру і Bihus.Info за допомогу в обміні даними: “Для наших антикорупційних розслідувань важливо мати доступ до ключових наборів даних, включаючи закупівлі, декларації про активи та політичні фінанси. Завдяки допомозі Bihus.Info ми зможемо легше знайти зв’язки українських компаній з незаконними офшорними фінансами, що є типовою ознакою фінансового злочину. Ми прагнемо створити більш широку мережу експертів з питань боротьби з корупцією та неурядових організацій у всьому світі, щоб ми могли знайти навіть найімовірніші зв’язки, встановлені транснаціональною організованою злочинністю”.

Відповідно, у Bihus.Info планують продовжувати ділитися українськими даними зі світом, на черзі реєстри помічників народних депутатів, реєстри компаній, дозволів та звіти акціонерних товариств.