Hlídáme je, protože si to zaslouží!

V historii ČR po 1989 považuji za zásadní existenci tří zákonů. Ústavy ČR, Zákon o svobodném přístupu k informacím (106/1999 Sb.) a Zákon o registru smluv (340/2015 Sb).

Všechny tyto zákony garantují lidem svobodu a právo kontrolovat stát, samosprávné orgány a politiky. Jsou základními kameny nutné digitalizace státu.

Od roku 1990 do dneška došlo a stále dochází k obrovským ztrátam a úniků peněz ze státního a místních rozpočtů, a to v důsledků klientelismu, úplatků a katastrofální neefektivity státu. Mohl bych vyjmenovat stovky zakázek a aktivit státu, které v prostředí soukromých firem vznikají zcela běžně za 1/10 ceny, 1/10 provozních nákladů a ve výrazně vyšší kvalitě.

Tento server má za cíl

Jak zpracováváme data z registru smluv

Základem je pravidelné stahování metadat registru smluv z měsíčních XML dumpů.
Poté pro všechny nové smlouvy (či změněné) stáhneme přílohy - to jsou obvykle texty smluv a příloh v PDF a Office formátech.

PDF s texty smluv a Office dokumenty jsou relativně snadné na zpracování, z nich vytáhneme texty smluv a uložíme je do systému, takže se dají prohledávat i texty smluv. Horší je to s oscanovanými smlouvami, které tvoří téměř 30 % dokumentů. V takovém případě provedeme OCR analýzu dokumentu a pokud byla úspěšnost převodu scanu na text vyšší než 80 %, pak tento text uložíme do databáze.

Tím je hotové hrubé zpracování záznamů a poté nad každou smlouvou provádíme analýzu z několika hledisek:

  1. Ověření platnosti formálních údajů
  2. Kontrola uvedených cen s DPH a bez DPH, zda jsou spočítány správně (tisíce smluv nejsou)
  3. Kontrola úplnosti údajů o smlouvě, včetně validace a ověření v obchodních a dalších rejstřících
  4. Analýza protiprávních kroků - typicky podepsání smlouvy dříve, než vznikla dodavatelská firma
  5. Analýza vztahu politiků k dodavateli ve smlouvě a nalezení konfliktu zájmů
  6. Statistické výpočty (např. dodavatelé s největším podílem na zakázkách)
  7. Hledání podezřelých okolností (dělení zakázek, smlouvy s novými firmami, apod.)

Poděkování

Server vznikl v polovině srpna 2016 a nevznikl by bez pomoci těchto lidí a institucí:

Další partneři a poskytovatelé dat:

Chcete využít data ze serveru pro vlastní potřebu či prezentaci? Licence k použití je jednoduchá.

Chtěli byste pomoci? Pomocí či penězi? Bez obav mě kontaktujte. Díky

Michal Bláha
15.8.2016