Хаклаб/Проекти/Енабавки: Разлика помеѓу преработките
Прејди на прегледникот
Прејди на пребарувањето
Нема опис на уредувањето |
Нема опис на уредувањето |
||
(Не е прикажана една меѓувремена преработка од истиот корисник) | |||
Ред 15: | Ред 15: | ||
## која фирма добила најмногу договори | ## која фирма добила најмногу договори | ||
##која фирма добила најмногу пари | ##која фирма добила најмногу пари | ||
=== Отворени прашања === | |||
# Crawler-от да биде scrapy? | |||
# Базата couchdb или postgresql? | |||
Последна преработка од 12:21, 2 декември 2013
Цел
На сајтот на бирото за јавни набавки се објавуваат договори за набавки кои ги склучуваат сите? државни институции и дел од јавните претпријатија. Форматот не е многу корисен за да може да се прават анализи и слично.
Целта е да ги преземеме сите објави да ги ставиме структуирано во база на податоци за да може кој сака да прави интересни инфо-графици и слично со тие податоци.
Чекори
- Парсер на табелите од Листа на известувања за склучени договори кој ќе ги земе сите објави во некоја година.
- Crawler кој ќе ги земе сите објави (пр. Известување бр. 03/2013) од нив ќе ги извади интересните податоци (Назив на договорниот орган, Име на носителот на набавката...) и ќе ги зачува во некоја база на податоци.
- Разни анализи на податоците
- графови со релации која фирма добива договори од која институција
- кој институција троши највеќе пари
- која фирма добила најмногу договори
- која фирма добила најмногу пари
Отворени прашања
- Crawler-от да биде scrapy?
- Базата couchdb или postgresql?
Завршено
- Парсерот кој ги вади линковите од сите објави на https://github.com/skopjehacklab/e-nabavki