Отворени податоци

Од Сподели wiki
Преработка од 21:45, 17 октомври 2012; направена од Petrushev (разговор | придонеси) (нова страница: Отворени податоци; поставена дефиниција и карактеристики)
(разл) ← Претходна преработка | Последна преработка (разл) | Следна преработка → (разл)
Прејди на прегледникот Прејди на пребарувањето

Отворени податоци се оние кои се слободно достапни за секого, за било каква намена и без ограничување со авторски права, патенти или други механизми на контрола. Концептот за отворени податоци постои одамна, но дури неодамна се направени обиди за формално дефинирање, како дефиницијата која ја зададе Фондацијата за Отворено Знаење:

Содржини или податоци се отворени ако секој може слободно да ги користи, еднаш или повеќе пати, и да ги прераспределува под услов, најмногу, со барање за атрибуција или слична прераспределба.

Отворените податоци најчесто се поврзуваат со владините податоци и податоците од јавен интерес и податоците стекнати при научни истражувања, но постојат и примери за податоци од приватниот и невладиниот сектор. Аргументите за отвореност најчесто се:

  • Податоци кои припаѓаат на човечката раса - податоци за организмите, делови од геноми, еколошки и географски податоци.
  • Податоци стекнати со јавно финансирање - креирани во владини институции или истражувачки центри финансирани од буџет.
  • Бизнис статистики од приватниот сектор заради поголема компетитивност
  • Податоци кои можат лесно да се дознаат - на пример, имиња на улици и адреси на јавни објекти.
  • Нужна поголема транспарентност на администрацијата


Карактеристики

Постојат неколку карактеристики кои ја отсликуваат отвореноста на еден сет на податоци.

  • Комплетност - потребно е податоците да бидат комплетни, односно, да се одраз на сите испитувања или истражувања без елиминација или обработка; вклучително и сите метаподатоци кои, по дефиниција објаснуваат што се содржи во сетот на податоци. Доколку има изведени податоци, потребно е да се вклучат и формулите, алгоритмите и методите на пресметување и изведување.
  • Примарност - тесно поврзано со комплетноста, подоците треба да бидат онака како што пристигнале од оригиналниот извор. Ова понекогаш овозможува јавна верификација на податоците и поголема скрутинизација на изворот на податоци.
  • Навременост - податоците треба да бидат објавувани што поскоро по стекнувањето. Приоритет за објавување секогаш треба да се даде на податоци кои се временски осетливи (податоци кои во себе содржат временски рамки). Ова овозможува изработка на апликации кои работат во реално време.
  • Пристапливост - потребно е податоците да бидат лесно пристапливи, не смее да бидат поставени зад firewall, не треба да биде потребна автентикација, и треба да се во отворен формат. Автентикацијата секогаш го успорува пристапот, а најчесто и го оневозможува. Затворени (proprietary) формати го отежнуваат пристапот зашто корисниците треба да имаат апликација која може да го препознае затворениот формат и кои најчесто се плаќаат и не се слободен софтвер.
  • Машинска читливост - тесно поврзано со пристапливоста и комплетноста, податоците треба да бидат машински читливи. Секоја апликација за обработка на податоци треба да може лесно да ги вчита, да ги разбере поднесените метаподатоци и да ги обработува без рачно коригирање или дополнување. Ова овозможува апликациите кои ќе ги користат овие податоци да не зависат од нечие рачно внесување, што често може да доведе до грешки и недоследности.
  • Недискриминантност - податоците треба да бидат достапни секому, без разлика дали корисникот е од невладиниот сектор, администрацијата, приватниот сектор, религиозни или едукативни заедници.
  • Постојаност - тесно поврзано со навременоста, временски осетливите податоци треба да останат отворени и откако ќе се добија понови, ажурирани податоци. Ова овозможува лесна споредба на историски факти и временска анализа на податоците.
  • Достапност - секој сет на податоци треба да биде регистриран во некој директориум. На пример, ако сетот е поставен на интернет, потребно е да може да се дојде до него со неколку линкови од почетната страна, а не само ако се познава конечната адреса. Ова бара категоризација и групирање на разни сетови на податоци.