Openformats.org

Од Сподели wiki
Прејди на: содржини, барај

Што е формат?

Кога пишувате текст, изменувате слика, создавате веб страни, слушате песна или гледате некој од Вашите омилени филмови на вашиот компјутер, се справувате со датотеки. За овие датотеки да може да бидат отворени, прочитани и изменети со Вашите апликации, тие мора да бидат во некаков формат. Форматот е тоа што овозможува апликацијата да ги разбере податоците кои се складирани во датотеката. Форматот, со други зборови, е режим за претставување на овие податоци. Многу често, форматите на датотеките се обележани со три знаци нарешени екстензија или проширување, кое следува по нивното име. На пр. mypage.htm е документ напишан во HTML; Има специфични формати за слики (како JPEG, PNG, GIF, TIF, BMP), обични текстуални датотеки (ASCII, најчесто обележани со проширувањето .txt), за форматиран текст (HTML, RTF, DOC, ODT) и документи за испраќање на печатач (PDF или PS).

Отворени и затворени формати

За да работите со датотека, најчесто е потребна апликација која ќе Ви дозволи да читате, уредувате и зачувате податоци содржани во дадената датотека.

Отворен формат - Форматот на датотеката е отворен ако режимот за претставување на податоците е транспарентен и/или спецификациите за форматот е јавно достапен. Отворените формати се вообичаени стандарди предодредени од јавните авторитети или интернационални институции чија цел е да воспостават норми за софтверска интероперабилност. Сепак постојат случаи кога спецификациите за отворените формати издадени од некоја компанија се јавно достапни за секого. Треба да се забележи дека отворените формати можат да се испрограмираат на транспарентен начин (читливи во секој текстуален уредувач, како што е случајот со маркап јазиците) или во бинарен режим (нечитливи во текстуален уредувач но преку декодирање се добиваат спецификациите на датотеката).

Затворен формат - Форматот на датотеката е затворен или неслободен ако режимот за претставување на податоците е недостапен и неговите спецификации не се јавно достапни. Неслободните формати се развиени од софтверски компании со цел да овозможат кодирање на податоците произведени од нивните апликации. Само софтверот произведен компанијата која ги поседува спецификациите за форматот на датотеката ќе може правилно и целосно да чита и запишува податоци од/во датотеката. Неслободните формати исто така може да се заштитат и преку употребата на патенти и сопственикот на патентот може да бара финансиски или други средства за користење или имплементација на форматот во софтвер изработен од трето лице.

Терминолошка забелешка: овде велиме неслободен, за разлика од другите што велат затворен. Не сакаме да сугерираме со нашиот избор на термини дека се што не е неслободно задолжително е и јавно достапно за сите. Потенциравме во претходниот пасус дека има многу формати чии спецификации се јавни (=отворени) кои сепак се развиени од софтверски компании. Разликата помеѓу отворен и неслободен (или затворен) формат, се состои исклучиво во јавно-достапните спецификации на тие формати.

Користење и разменување на датотеки во неслободен формат

Неслободните формати се нашироко употребувани денес, поради тоа што се користат од многу апликации за процесирање податоци. Неслободните формати ги кодираат податоците на начин што само апликацијата која ги создава може да ги отвора. Спротивно, слободните формати гарантираат дека датотеката ќе може да биде отворена со било кој софтвер напишан за таа цел. Разликата помеѓу отворените и неслободните формати може да биде незабележителна во случаи на локално користење на датотеките. Под локално користење, се мисли на личното користење на датотеки за сопствените потреби, но исто така и на споделување датотеки со други корисници кои дошле до заклучок кој софтвер да го користат за да ги отворат. Се додека употребата не е локална и датотеките се разменети (преку ставање на Интернет сервери, објавување, испраќање преку е-пошта и преку било кој друг начин на кој испраќачот и приемачот немаат взаемен договор кој софтвер да го користат за проследување на податоците), разликувањето на отворените и неслободните формати ќе е многу важно.

Четири причини да не користите неслободни формати

Неслободните формати може да се користат локално без ризик за корисникот по неговите лични потреби или од група на корисници кои претходно се договориле да користат одреден формат и софтвер преку кој ќе соработуваат за дадени цели. Од друга страна пак, споделувањето на датотеки е заедничко делување, чии ефекти влијаат не само на корисникот индивидуално, но исто така и на групата на потенцијалните корисници на податоците во тие датотеки. Споделувањето на датотеки бара конвертирање на оригиналниот формат во формат соодветен за нивно споделување. Отворените формати по дефиниција се формати за разменување, осигуруваат пристапност, интероперабилност и интегритет на податоците. Кога разменувате датотеки во неслободни формати, придонесувате во пропагирањето и присилувањето на корисниците да применуваат туѓи принципи.

Ризик по пристапот до податоците

  1. Неслободните формати го прават користењето на специфичен софтвер задолжително за овозможување на пристап до податоците во датотеките на тој формат. Преку разменување на датотеки во неслободен формат, практично земате во предвид дека приемачот на датотеката го има потребниот софтвер за отворање и проследување на податоците. Секој корисник кој заради технички причини (пр. корисници кои работат на различна платформа) или финансиски причини (корисници кои не можат да си дозволат купување на бараниот софтвер) не можат да го користат специфичниот софтвер, нема да може да ја отвори датотеката испратена во неслободен формат.
  2. Да претпоставуме дека корисникот ја поседува апликацијата потребна за отворање на датотеката. Дали ова е гаранција за целосна пристапност до податоците во датотеката? За жал не! Стратегија применете од производителите на софтвер, се состои во редовно надоградување на податоците на форматот кои го имплементираат во нивните апликации. Таквата стратегија значи и заложништво за корисникот при употребата на специфичен неслободен софтвер. На овој начин, единствениот начин корисникот да ја осигура пристапноста до неговите податоци во иднина е редовно да купува и да го надоградува специфичниот софтвер.
  3. [Полу-слободни формати и принципи на грабање]. Слична стратегија за заклучување на корисникот со одреден формат на датотеки, е прифаќање на слободен формат на почетокот, се додека корисникот не стане зависен од форматот, по што понатаму ќе следат измени за кои компанијата/производителот ќе каже дека се нивна сопственост, што ќе допринесе до некомпатибилност на оригиланиот формат на датотеките со друг софтвер за таа цел. Оваа стратегија често е прифатена при конвертирањето на јавните стандарди во полу-слободни формати.

Прифаќањето на неслободните или полу-слободните формати е резултат на корпорациските стратегии кои се насочени против потребите на корисниците, кои треба да ја имаат привилегијата за пристапност, интероперабилност и постојаност на разменетите податоци.

Ризик за пренос на доверливи информации

Неслободните формати ја кодираат информацијата која не е јавно видлива. Само создавачот на форматот или сопственикот на софтверот може го чита форматот и кој го има „клучот“ за целосно декодирање на форматот може да пристапи до податоците во датотеката.

Често, кога податоците се зачувуваат, софтверот додава информации кон датотеката чиј преглед е недостапен за обичниот корисник, како што е корисничкото име, серискиот клуч на софтверскиот производ, типот на оперативниот систем, компјутерот на кој корисникот работи, директориумот каде што стоела датотеката итн. Некои од овие информации може често се складираат во читлива форма за корисниците, без знаење на авторот и може да бидат пристапни од секого: анегдотата со анонимниот политички манифест испратен во MSWord формат со името на авторот достапно во Својствата на документот е веројатно најпознатиот случај за неочекувани последици при користење на неслободни формати како и размената на податоци во вакви датотеки. Има и посериозни последици отколку неможноста да се заштитат личните податоци, како пренесувањето на воени информации или трговски тајни. Интересно е да се знае дека луѓето, без да им трепне око прифаќаат, дека Министерството за одбрана на некоја земја создава и споделува документи со информации достапни само за приватни компании во странство. Преносот на документи во неслободни формати значи и пренесување на информации за кои никој речиси и не знае, освен сопственикот на софтверот кој може да го проследи форматот.

Вируси и ризик Вие се заразите

Најчесто вирусите се прошируваат преку инфицирани датотеки споделени помеѓу корисници. Таквите вируси ги експлоатираат пропустите во некоја апликација или безбедносна архитектура на некој оперативен систем, за да извршат злонамерен код. Размножувањето на вируси во овие случаи се потпира врз фактот што мнозинството корисници користат ист тип на софтвер и споделуваат податоци на стандардниот неслободен софрмат на тој софтвер. Така, многу од вирусите не се само специфични за одредена системска платформа, туку и специфични за одреден апликативен софтвер. Во многу случаи, преку користењето на различни апликации, системот е имун на овие типови на вируси (пр. големиот број на макро-вируси за MS Word). Користењето на отворени формати кои не зависат од одреден софтверски производ и платформа, ги прави податоците интероперабилни и пристапни од секаде, го ослабнува ширењето на вируси и обесхрабрува нивното распространување. Многу е лесно да создадете вирус кој ќе ги експлоатира непознатите пропусти на едноставна, широко-употребувана апликација, отколку ставање на злобен код во формат кој може да се прочита од голем број апликации на различни платформи

Поддршка на постоечките монополи

Овој проблем можеби и не е од значење за обичниот корисник, но има значително влијание врз заедницата на корисници. Преку разменување и објавување на податоци во неслободен формат, корисниците се присилуваат да користат ист софтвер со кој датотеката е создадена. Тоа значи дека „ако не го користите софтверот X, нема да можете да ја прочитате датотеката“. Оваа пракса, која се појавува кога разменувате датотека во даден формат преку само-заклучокот дека сите останати го користат истиот софтвер, има двократни последици:

  1. Од една страна, оваа пракса Ве присилува да користите неслободен формат во сопственост на некоја компанија како стандарден формат. Тоа значи дека интероперабилнотса, пристапноста и интегритетот на податоците, е во заложништво на политиката на дадена компанија. Ако производителот на софтвер одлучи или е приморан да прекине со развојот на овој софтвер потребен за интерпретирање на даден формат, сите ваши постоечи податоци во нивниот формат наеднаш ќе престанат да бидат корисни, затоа што спецификациите на форматот не се јавно достапни, ќе биде невозможно да ги извлечите податоците од кодираната датотека.
  2. А пак од друга страна, преку поддршката на монополите, на нефер начин се уназадува конкурентноста помеѓу производителите на софтвер што, да признаеме, е суштински услов за технолошкиот напредок, и се ослабнуваат иницијативите за промоција на отворени формати, нивни спецификации и јавни стандарди, кои се минимум гаранција за фер и слободна конкурентност.

Четири причини за прифаќање на отворени формати

Користење на отворени формати при разменување на податоци значи:

  1. Обезбедување на пристапност и постојаноста на Вашите податоци. И Вие и корисниците на Вашите податоци ќе бидат во можност да пристапат и проследат тие податоци.
  2. Обезбедување на комплетно транспарентност за содржината на Вашите датотеки.
  3. Ограничување на ширењето на вируси. Прифаќањето на отворените формати драстично помага за намалување на ризикот од заразување.
  4. Промоција на разноличност и интероперабилност во сферата на електронските комуникации.

Кои неслободни формати треба да се избегнуваат

Неслободните формати не се формати за разменување. Повеќето податоци кои се зачувани во неслободните формати и кои се наменети за широките маси и електронско издаваштво може лесно да се конвертираат во соодветен отворен формат (преку користење на слободни апликации кои овозможуваат манипулирање со отворени формати)

Формати кои треба да се избегнуваат

  • MS Word форматиран текст за документи (doc);
  • MS Excel табели и бази со податоци (xls, xlw);
  • MS PowerPoint презентации (pps, ppt);
  • Слики со 256 бои (gif);
  • Bitmap слики (bmp, tiff (видете подолу))
  • Vectorial image (WMF)
  • Mp3 аудио датотеки (mp3)
  • Windows Media Audio (wma)

Неслободни формати со јавни спецификации

Некои формати за датотеки остануваат неслободни и покрај тоа што спецификациите се од јавен карактер. Фактот што спецификациите им се јавно достапни не е индикација дека ќе бидат и во иднина, со забрани во нивните лиценци и имплементацијата на форматот или и двете. На пример:

  • Flash, во сопственост на Adobe;
  • TIFF, исто така во сопственост на Adobe;

Отворени формати кои треба да се користат

Plain text

Најлесниот начин да прегледувате, читате и запишувате текст е да користите Plain text/Обичен текст/ формат.

Кога и и да можете, избегнувајте користење на форматиран текст: користењето на обичен текст (ascii или .txt формат) гарантира пристап за секого, без разлика на софтверот или платформата што се користи. Во вашите пораки по е-пошта, ако за Вас е поважна содржината, а не формата на текстот, користете обичен текст за испраќање, директно во телото на вашата порака, наместо испраќање како прилог. Обичниот текст не може да носи вируси, екстремно е лесен и може да се користи за создавање табели (со табулации или запирки) со било кој софтвер кој може да го отвора.

HTML

Ако имате потреба од размена на документи со слики и форматиран текст, најдоброто решени е HTML форматот.

HTML (Hypertext markup language) е стандарден јазик за Мрежата, дефиниран од меѓународната организација за стандардизација (W3 конзорциумот). HTML е флексибилен универзален формат, богат и компактен. Стандардниот HTML (без Javascript) не може да носи вируси и може да се чита од било која платформа. Забелешка: HTML кодот произведен од MSWord е полу-слободен, и е склон кон ставање на податоци кои неможе да се прегледаат на сите платформи.

TeX

За издавање и форматирање на математички документи се користи посебен формат: TeX.

TeX е јазик за создавање документи, но и програмски јазик. Првично напишан за создавање математички документи за професионални цели, денес се користи за мно

LaTeX исто така се користи за создавање на документи и служи како програмски јазик. Впрочем претставува поедноставена верзија на TeX која овозможува манипулација на највисоко ниво на инструкциите (?), исто како што HTML е поедноставена верзија на SGML.

DVI. Tex или LaTeX изворниот код откако ќе се напише треба да се искомпајлира. Резултатот на компајлирањето е DVI форматот, читлив од многу платформи. Најчесто, резултатот од компајлирањето треба да се конвертира во PDF или PS датотека.

Отворен формат за документи

Ако треба да соработувате со тим и да работите на еден документ, но не можете да се справите со HTML датотеки, треба да користите Отворен формат за документи, стандардниот формат за документи за канцелариски апликации (OpenOffice.org, Abiword, KOffice, итн.) - или полу-отворените алетрнативи како Rich Text форматот.

Отворениот формат за документи е:

  1. Отворен, XML-базиран формат
  2. Отворен стандард, поддржан од OASIS (тимовите на IBM, Sun и ISO стандардите
  3. Стандарден формат за документи во OpenOffice.org 2.0 и KOffice 1.4
  4. Препорачан формат од Европската комисија
  5. Нашата најдобра можност да се бориме против неслободните и заклучени формати

RTF е претставен од Microsoft со цел создавање стандарден формат за форматирање на текст. Нуди исти можности како и DOC форматот и спецификациите се јавно достапни. Најголемиот дел од апликациите за обработка на текст се способни да читаат и запишуваат податоци во овој формат, но затоа што некои програми тежнеат да користат неслободни проширувања за овој формат, неговата компатибилност сепак е несигурна.

PostScript & PDF

За високо-квалитетни документи, PostScript и Portable Document Format се решение за тоа.

PostScript е јазик за опис на страни, развиен од Adobe во 1985, создаден за печатење и различни типографски цели. Една од предностите е дека е универзален (независен од форматот на датотеката во кој е сместен) и не може да носи вируси. Спротивно на PDF, PostScript не дозволува копирање на текст кој е прикажан на екранот и вметнување во друга апликација. Може да биде генериран со компатибилни печатари (опција: 'печати во датотека) и преку програмата GhostScript.

А пак, PDF (Portable Document Format), развиен исто од Adobe е формат за претставување на документи чии спецификации се достапни на Мрежата. Тој е универзален формат (без разлика на која платформа и со кој софтвер се користи и создава), компатибилен со било кој печатач, флексибилен (може да користите разни фонтови, врски, обележувачи и забелешки) итн. Може да се создаде со Adobe Acrobat, so речиси сите слободни канцелариски апликации, со GhostScript итн.

Формати за слики

Да ги разгледаме најважните отворени формати за процесирање слики препорачани за употреба.

JPEG е еден од најефикасните формати за компресија на слики. Овој отворен формат е „лесен“ и дозволува Вие да го одредите нивото на компресија, знаејќи дека колку поголема е компресијата, помал е квалитетот на сликата. JPEG се процесира преку т.н. натрупана компресија: сликата е значајно сменета ако ја отворите и зачувате со друго ниво на компресија. Варијанта на овој формат, прогресивниот JPEG, дозволува да го оптимизирате времето потребно за приказ на сликата на Интернет. Новиот JPEG_2000 стандард, моментално дефиниран, ќе дозволува подобар однос на квалитет и компресија, како и индексирање на сликата со клучни зборови.

PNG (Portable Network Graphics) доаѓа во форма на PNG-8 или PNG-24, и двата отворени формати ослободени од лиценца. Тие ја претставуваат принципиелната замена за GIF форматот, специјално создадени да го оптимизираат приказот на слики на Интернет. Форматот дозволува компресија на податоци без загуба на информации и е поддржан од речиси сите прелистувачи. Големината на PNG сликата сепак е значително поголема од еквивалент во JPEG форматот. Сепак, PNG во голема мера го зменува GIF за 8-битни (или помалку) слики.

SVG (Scalable Vector Graphics) е векторски формат кој се користи за векторска обработка на податоци/слики и кој постои благодарение на група за проучување создадена во 1998г. од страна на W3 конзорциумот. Ова е формат базиран на уште еден јавен стандард (XML, CSS, HTML) кој дозволува создавање на векторски слики на кои може да им се зголемува големината, совршени за заштедување на бендвит, се оптимизираат слоеви и има опции за зумирање без губење на квалитет на сликата. Графиките создадени во SVG може да се динамички или интерактивни, да се групираат, трансофмираат, да се создаваат графички објекти во други објекти и да им се даваат атрибути за изгледот.

Отворени аудио формати

Ogg Vorbis е аудио формат со компресија со загуба кој е целосно отворен, со слободна лиценца. Развиен е со цел да ги замени неслободните формати кои моментално се користат (Mp3, WMA, итн.).

Брзо обасјнување за тоа што значи имет:

  • Ogg е името на форматот развиен од Xiph.org за аудио, видео и мета-податоци.
  • Vorbis е името на шемата за аудио компресија која евентуално ќе биде вклучена во Ogg. Други формати кои може да се вклучат во Ogg се и Flac и Speex.

Има многу програми и библиотеки кои користат Ogg Vorbis датотеки за различни платформи (BeOS, Mac OS X, GNU/Linux, Windows, и сл.). Пример за два најпознати плеери кои овозможуваат пуштање на овој формат се Xmms за GNU/Linux и WinAMP за Windows.

FLAC е формат со компресија без загуба кој е целосно отворен. Може да се користи со неговиот стандарен контејнер или со Ogg контејнерот на Xiph.org.

Моментално може да се користи под GNU/Linux, Mac OS X и Windows. Како додаток, достапен е во две Java извршни датотеки што овозможува овој формат да се користи на било која платформа која ја поддржува Java виртуелната машина.