Хаклаб/Проекти/Енабавки

Од Сподели wiki
Преработка од 12:21, 2 декември 2013; направена од Глиша (разговор | придонеси)
(разл) ← Претходна преработка | Последна преработка (разл) | Следна преработка → (разл)
Прејди на прегледникот Прејди на пребарувањето
Free all the data


Цел

На сајтот на бирото за јавни набавки се објавуваат договори за набавки кои ги склучуваат сите? државни институции и дел од јавните претпријатија. Форматот не е многу корисен за да може да се прават анализи и слично.

Целта е да ги преземеме сите објави да ги ставиме структуирано во база на податоци за да може кој сака да прави интересни инфо-графици и слично со тие податоци.

Чекори

  1. Парсер на табелите од Листа на известувања за склучени договори кој ќе ги земе сите објави во некоја година.
  2. Crawler кој ќе ги земе сите објави (пр. Известување бр. 03/2013) од нив ќе ги извади интересните податоци (Назив на договорниот орган, Име на носителот на набавката...) и ќе ги зачува во некоја база на податоци.
  3. Разни анализи на податоците
    1. графови со релации која фирма добива договори од која институција
    2. кој институција троши највеќе пари
    3. која фирма добила најмногу договори
    4. која фирма добила најмногу пари

Отворени прашања

  1. Crawler-от да биде scrapy?
  2. Базата couchdb или postgresql?


Завршено

  1. Парсерот кој ги вади линковите од сите објави на https://github.com/skopjehacklab/e-nabavki