Хаклаб/Проекти/Енабавки

Од Сподели wiki
Прејди на прегледникот Прејди на пребарувањето
Верзијата за печатење повеќе не е поддржана и може да дава грешки. Подновете си ги бележнците во прелстувачит и користете ја можноста за печатење од самиот прелистувач.
Free all the data


Цел

На сајтот на бирото за јавни набавки се објавуваат договори за набавки кои ги склучуваат сите? државни институции и дел од јавните претпријатија. Форматот не е многу корисен за да може да се прават анализи и слично.

Целта е да ги преземеме сите објави да ги ставиме структуирано во база на податоци за да може кој сака да прави интересни инфо-графици и слично со тие податоци.

Чекори

  1. Парсер на табелите од Листа на известувања за склучени договори кој ќе ги земе сите објави во некоја година.
  2. Crawler кој ќе ги земе сите објави (пр. Известување бр. 03/2013) од нив ќе ги извади интересните податоци (Назив на договорниот орган, Име на носителот на набавката...) и ќе ги зачува во некоја база на податоци.
  3. Разни анализи на податоците
    1. графови со релации која фирма добива договори од која институција
    2. кој институција троши највеќе пари
    3. која фирма добила најмногу договори
    4. која фирма добила најмногу пари

Отворени прашања

  1. Crawler-от да биде scrapy?
  2. Базата couchdb или postgresql?


Завршено

  1. Парсерот кој ги вади линковите од сите објави на https://github.com/skopjehacklab/e-nabavki