Autorski članci
uređuju Dragan Grbić i Branislav Mihaljev, MVP

Bookmark and Share
Matična strana sajta
  Novo na sajtu
  Mapa sajta
  Beleške
  Kontakt
  Pretraga MSKB

 Blog Praktikuma
  RSS feed
  P@W @Tw

  Izvezi stranicu u PDF
 
Office Praktikum

Autorski članci
 


Skoro svakodnevno slušamo
  Radio Paradise:
  eklektični muzički online radio bez reklama!
 

 
       

Sponzori sajta

SBB CS 1.6 game server: 82.117.200.1
 
Connectivity by SBB

 
Suština pasijansa
Suština pasijansa
 


 

Informacije

NOVOSTI

I još dva nova priloga o Excelu
Novi prilozi o Wordu
Novi i prilozi u temi "razno o Officeu"
Novi članci o novostima u Officeu 2010!

SADRŽAJI ZA PREUZIMANJE

Lokalizacija Total Commandera 7.51Obe jezičke školjke za popularni program na srpskom sad funkcionišu u bilo kojoj varijanti Windowsa!
RNDalica.ExcelDodatak za Excel 2007/2010 za generisanje slučajnih podataka!
YuConv.ExcelDodatak za Excel 2007/2010 za konverziju pisama!
YuConvNetDodatak za Word 2007/2010 za konverziju pisama i kodnih rasporeda!

SKREĆEMO PAŽNJU

Kako pretraživati MSKB
a pronaći ćete i još mnogo novih sadržaja...

KONTAKT

Da li znate za pravila koja važe pri kontaktu sa nama? Molimo vas da se obavestite o tome!
 
POZIVAMO VAS

i prenesite svoja iskustva. Najbolji prilozi će biti objavljeni.

  (C) 2000-2010 Praktikum na Webu
 

Microsoft Office 12: Novi formati za Office dokumente

Nivo:  NIVO 3 - klinite za objašnjenje


Piše: Dragan Grbić

Najzad će se desiti! Početkom juna 2005, Microsoft je najavio dramatičnu izmenu kursa na planu formata datoteka u sistemu Office. Ako niste dosad, vreme je da pružite blagovremenu dobrodošlicu XML formatu u svom budućem redovnom radu.

Teško da bismo mogli reći da je reč o nekom iznenađenju. Ima barem pet godina, ako ne i više, otkako mnogi komentatori u predvečerje nove verzije paketa Microsoft Office prognoziraju da će baš ona doneti novi format datoteka. Uobičajeno, tada bi prognoza bila praćena plašljivim komentarom "ama, neće aljda", uz opis nekakvog apokaliptičnog scenarija u kome se sve što je bilo dobro napušta, a počinje sve što može da bude loše. Najčešća verzija takvih prognoza uoči verzija Office XP i Office 2003 beše ona koja je najavila HTML format kao podrazumevan. Istina, baš je Office XP najzad rešio mnoge prethodne probleme i neusaglašenosti koje su pratile konverziju sadržaja Office dokumenata u univerzalni format, ali osnovni format glavnih programa je i dalje ostao binarni, tek uz blage modifikacije specifikacije binarnog zapisa koje su postavljeni još 1994. godine, a promovisani u vreme objavljivanja paketa Microsoft Office 97. Ta specifikacija je preživela do današnjih dana zahvaljujući ondašnjoj ideji o fleksibilnom uređenju datoteke-kontejnera, gde je bilo mesta za nove primene i čuvanje karakterističnih sadržaja koje smo dobili u kasnijim verzijama. Štaviše, zahvaljujući baš takvom načinu pakovanja, nove datoteke je moguće otvoriti u starijim verzijama programa, pri čemu se osnovni sadržaji uredno vide, a oni elementi koje stara verzija ne podržava – jednostavno se ignorišu.

Međutim, preostao je jedan ne baš mali problem, a on je iz dana u dan sve izraženiji: koliko je prijemčiv namenski format datoteke u uslovima sve većeg broja kombinacija veza u složenim aplikativnim rešenjima? Da li je dovoljno to što objektni model Office dokumenata dozvoljava spoljnu programiranu kontrolu? Da li se takav pristup može smatrati univerzalnim?

Staro pitanje, novi odgovor

Problem univerzalnosti zapisa pri računarskoj obradi podataka postoji otkad postoje računari. Međutim, verovatno je tek ekspanzija PC tehnologije dovela do toga da taj problem ispliva u prvi red: setite se da i najobičnija tekstualna datoteka nije jednako čitljiva na raznim platformama, osim ako raspolažete programom koji može transparentno da tumači oznake za kraj reda. Translacije podataka između heterogenih sistema za upravljanje bazama podataka je rešavan štapom i kanapom, dok nije uspostavljen implicitni standard za primenom CSV formata, ako već ne može drugačije. 1989, godine, iz CERN laboratorija je krenuo HTML, da bi postao uzrokom najveće tehnološke ekspanzije dvadesetog veka: World Wide Web predstavlja prvi globalni uspeh u prevazilaženju pitanja platforme sa koje se pristupa nekom sadržaju. Naravno, bilo je i tu raznih problema, a ima ih i dalje, ali to se svodi na pitanje poštovanja standarda.

A onda je krajem devedesetih došao XML, redukovani oblik složene SGML metode meta-zapisivanja, koji je značio korak dalje u traganju za otvorenim i opšte prihvaćenim pristupom univerzalne čitljivosti. Najpre uvodeći strogost u načinu pisanja, čega u klasičnom HTML-u nema, XML je otvorio put za tehničku razmenu zapisa podataka u svim oblicima. Osim kvantitativnog zapisa podataka, ta specifikacija omogućuje i beleženje konteksta, tj. značenja. Zahvaljujući proširenoj specifikaciji, podacima se može pridružiti i šema koja definiše okvir upotrebe, a metamodel je takav da omogućuje bilo kakvo specifično prilagođavanje potrebama. Uz sve to, reč je o tekstualnom zapisu koji može da pročita bilo koji računar, ma kako da pristupi izvoru. Razni namenski protokoli za razmenu (u prvom redu SOAP) omogućili su mnoge automatizacije procesa, pa čak i to da dve različite platforme automatski razmenjuju podatke; ali, to već pripada nekoj drugoj priči.

U vezi sa ovom najavom, usput otkrivamo neke zanimljive novosti koje se tiču ophođenja najvećeg proizvođača softvera prema zajednici korisnika. Izgleda da u Microsoftu duvaju neki novi, pozitivni vetrovi: samo dve nedelje nakon prve zvanične, šture najave o tome kako bi sledeći Microsoft Office 12 trebalo da izgleda, krenule su i tehničke informacije na tu temu. Prva od njih, a teško da će uopšte postojati značajnija vest od ove, jeste ona o zvaničnoj odluci Microsofta da podrazumevani format datoteke za sledeći Word, Excel i PowerPoint bude zasnovan na XML specifikaciji otvorenog koda. Službeni naziv ove inicijative je Microsoft Office Open XML Format; pregledajući prve tehničke dokumente posvećene toj novosti, zvanično otvaramo seriju priloga o sledećem Microsoft Officeu, čiji izlazak na tržište očekujemo u drugoj polovini 2006. godine.

 Principijelna šema datoteke-kontejnera Postojeći format datoteka glavnih Office programa, kako stoje stvari, zreo je za penziju. Sve intenzivnije učešće Office dokumenata u nezavisnim aplikativnim rešenjima dovelo je do kritične količine upozorenja o problemima koji nastaju u raznim prilikama. Iako već nametnuti kao implicitni standard (znate li neki alternativni paket iste namene koji ne podržava formate DOC, XLS i PPT?), binarni formati su se pokazali kao nedovoljno robusni u uslovima primena za kojima ranije nije bilo potrebe, posebno u "šarenim" mrežama u kojima figurišu raznoliki uređaji za pristup podacima. XML format, koji je već osvojen kao alternativni pravac u aktuelnom Officeu 2003, nameće se kao logično rešenje. Ali, ne samo da će biti rešeno pitanje univerzalnog pristupa dokumentu, nego će ovo biti prilika da se Microsoft reši nekih starih balasta i da otvori prostor za neke nove mogućnosti – kako tehničke, tako i one druge.

Struktura za svakoga

U suštini, novi format je ZIP arhiva u kojoj se nalaze XML kompatibilni sadržaji i šeme. Više XML datoteka opisuje matične podatke o dokumentu, metapodatke i korisničke sadržaje, dok se uvezeni sadržaji (OLE objekti, slike, itd.) čuvaju u osnovnom obliku. Ukratko, ZIP format održava princip rada sa jednom datotekom, a realno više komponenti preslikava modularnost dokumenta i održava nužnu fleksibilnost. Pošteno govoreći, ovo nije ni novo ni originalno rešenje. Recimo, ima više od dve godine kako smo videli takav pristup u paketu OpenOffice.Org, što je bila posledica nastojanja firme Sun da blagovremeno razreši pitanje istog formata datoteke za sve platforme na kojima će paket raditi (zapravo, ovo je rešenje stvoreno za njihov komercijalni paket StarOffice). Naravno, Microsoft po običaju ekstrapolira svoje korake na "veliku sliku", jer Office predstavlja okosnicu klijentske strane u celokupnoj paleti proizvoda za poslovnu primenu. Već sad, Microsoft govori o očiglednim karakteristikama i posledicama koje će iskusiti njihovi korisnici. Stoga već sad znamo da će i dalje postojati podrška starim formatima, što je mera očuvanja vertikalne kompatibilnosti, ali i sa stanovišta sprečavanja svih mogućih neusaglašenosti koje bi mogle da proisteknu; budete li tako hteli, i dalje ćete podrazumevano raditi sa binarnim formatima. Takođe, blagovremeno će biti objavljeni dodaci za Office 2000/XP/2003 koji će omogućiti upotrebu novih formata datoteka u tim verzijama programa, tako da ne bi trebalo da očekujemo bogzna kakve poremećaje u radnim navikama.

 Dijagram relacija u radnoj svesci Prva najavljena karakteristika koncepta Open XML Format, koja bi trebalo da se tiče svakog, jeste potpuna otvorenost i sloboda upotrebe formata. Specifikacija za formate i šeme će biti objavljena i javno dostupna pod licencom za slobodno korišćenje (royalty-free), nalik onoj koja danas postoji za Microsoft Office 2003 Reference Schemas. Dakle, svako će imati pravo da pregleda i menja strukturu i sadržaj Office datoteka svim raspoloživim sredstvima, a format će omogućiti da to bude lakše izvodljivo nego ranije. Iz ove osobine proističe i interoperativnost: XML je po prirodi takav, a jezgro specifikacije i šema za Office dokumente će zadovoljiti otvoreni standard. Drugim rečima, svako će moći da napravi alatku koja kreira, čita ili menja Office dokument. A da ne bi bilo nejasnoća, podrazumevaće se i projektovana bezbednost dokumenta: mada može da zvuči kontradiktorno, Open XML Format sigurnije obezbeđuje datoteke. Dokumenti se mogu pouzdano razmenjivati na osnovu identifikacionih informacija koje su mogući deo dokumenta; takođe, lako je ukloniti razne zapise koje otkrivaju osetljive informacije o korisniku ili njegovoj platformi. Konačno, datoteke koje sadrže posebne elemente (npr. OLE objekti ili VBA moduli) još lakše će se identifikovati za potrebe posebnog procesiranja.

Za razliku od binarne datoteke-kontejnera, XML datoteke su po prirodi efikasne. Kompresovani sadržaj u ZIP datoteci koja sadrži više datoteka je skoro uvek manji od odgovarajućeg binarnog zapisa, što će dovesti do uštede u prostoru i vremenu transfera datoteka. Kolika će tačno ušteda nastati, zavisiće od konkretnog sadržaja; ispitivanja pokazuju da je novi format datoteke prosečno manji od polovine polazne binarne datoteke. Jedna od prirodnih posledica ovakvog načina čuvanja sadržaja jeste i veća robusnost: elementi dokumenta počivaju u više datoteka (recimo, svaki radni list radne sveske u Excelu će se sastojati od jedne ili više datoteka), što u krajnjoj instanci dovodi do mnogo manje verovatnoće nečitljivosti dokumenta i potpunog gubitka podataka; ako i dođe do nepovratnog narušavanja dela sadržaja, izvesno je da će manje podataka zaista biti izgubljeno. Takođe, način čuvanja sadržaja je takav da je sa njim lakše raditi, pa je manje verovatno da će nezavisni programi i alati kojima budete pristupili dokumentu van Office okruženja izazvati njegovo oštećenje.

Brojne posledice

Dokumenti sačuvani korišćenjem Open XML formata će imati nove tipove datoteka. Prvi razlog je prozaičan: tako ćete razlikovati Open XML Format dokumente od binarnih formata iz prethodnih verzija programa. Imena novih tipova se grade dodavanjem četvrtog slova na kraj: osnovni XML oblici za Word, Excel i PowerPoint će biti DOCX, XLSX i PPTX, respektivno. Postojaće i drugi tipovi za predloške (templates), programske dodatke (add-ins) i slične namenske formate. Drugi razlog za promenu tipova je "malo" ozbiljnije prirode i čini vrlo poželjnu posledicu sa stanovišta sigurnosti: na osnovu tipa, razlikovaćete dokumente i predloške koji sadrže makroe od onih koji nisu predviđeni ni za kakvu automatizaciju. Predviđeni sufiks tipa je slovo "m"; dakle, već kad vidite datoteku pismo.docm, i pre otvaranja dokumenta ćete znati da u njemu postoje makroi. Pogledajte tabelu da biste se upoznali sa svim novim tipovima.

vrsta dokumenta tip
Word 12 XML dokument .docx
Word 12 XML dokument sa makroima .docm
Word 12 XML predložak .dotx
Word 12 XML predložak sa makroima .dotm
Excel 12 XML radna sveska .xlsx
Excel 12 XML radna sveska sa makroima .xlsm
Excel 12 XML predložak .xltm
Excel 12 XML predložak sa makroima .xltm
Excel 12 radna sveska u binarnom formatu .xlsb
Excel 12 XML programski dodatak sa makroima .xlam
PowerPoint 12 XML prezentacija .pptx
PowerPoint 12 XML prezentacija sa makroima .pptm
PowerPoint 12 XML predložak .potx
PowerPoint 12 XML predložak sa makroima .potm
PowerPoint 12 XML programski dodatak sa makroima .ppam
PowerPoint 12 XML prezentacija spremna za projekciju .ppsx
PowerPoint 12 XML za projekciju sa makroima .ppsm

Novi formati dokumenata za Office 12 će podrazumevati i nove tipove datoteka. Na osnovu njih, programi će znati kako da barataju dokumentom. U tom procesu će postojati bolja kontrola nego ranije, što se najpre odnosi na automatizaciju u dokumentu.

Čak i ako ne budete imali nameru da uposlite bilo kakvu novu funkciju kojom biste proširili operativne mogućnosti, radeći sa novim formatima datoteka ne morate menjati svoje navike. Možete se zadovoljiti raznim "banalnim" prednostima, kao što su lakša manipulacija manje datoteke ili spoljna provera prisustva makroa u dokumentu. Međutim, pred vama se otvara prostor za mnoge nove mogućnosti; izvesno, neke od njih ste i do sada mogli da koristite, a verovatno niste, jer podrazumevaju angažovanje relativno novih tehničkih zahvata. Dovođenjem na nivo prirodnog elementa, XML funkcionalnost će biti jednostavnija za primenu. Pomenimo samo neke moguće scenarije na najvišem nivou – u poslovnom okruženju zasnovanom na centralnom skladištu dokumenata.

 Zapis svojstava dokumenta u DOCX datoteci,
 komponenta docProps\Core.xml Open XML format može da unapredi proces manipulacije nad sadržajem dokumenata na serveru, bez angažovanja objektnog modela za Office, nego direktnom aktivnošću u XML sadržaju; naime, iako je to moguće i u praksi se relativno često koristi, Office načelno nije predviđen za izvršavanje na serveru. Razvojni tim može da formira namenske aplikacije koje se izvršavaju na serveru koje prema nekom pravilu, recimo u odnosu na lokaciju dokumenta ili prema datumu, dodaju ili osvežavaju delove dokumenta. Na primer, to može biti usaglašeno zaglavlje ili memorandum zvaničnog dokumenta, neki formalno-pravni sadržaj na dnu fakture (u Wordu biste to radili funkcijom AutoText), radni list u kome se u određenim okolnostima menja sadržaj matičnih podataka (kursna lista, cenovnik, itd) i slično. Ukoliko dokument sadrži makroe koji su služili za njegovu pripremu, moguće je formirati pravilo i funkciju koja ih uklanja u času kada dokument sačuvate u arhivi na serveru. Primera radi, zahvat nad takvim dokumentom je tehnički lako izvodlji: potrebno je fizički ukloniti komponentu VBAProject.bin iz datoteke-kontejnera i izbrisati pripadajuće relacije u glavnom zapisu o dokumentu.

S obzirom na to da se struktura dokumenta u XML obliku formira kao spisak relacija između komponenti, to u doslovnom smislu znači da je nekim procesom automatizacije mimo sistema Office moguće sklopiti dokument. Office šeme su podrazumevano vrlo složene, ali to ne znači da ih morate koristiti u celosti: svaka Office aplikacija će moći da otvori dokument sa minimalnim brojem definisanih stavki. Naravno, sklapanje dokumenta može teći u celosti od nule, ali u praksi će to verovatno značiti delimično korišćenje gotovih delova iz raznih postojećih dokumenata ili formirane biblioteke komponenti, bilo da je reč o podacima, metapodacima ili drugim objektima.  Zapis relacija među komponentama
 radne sveske sa dva radna lista Ako metodama čuvanja dokumenata dodate polise sigurnosti, spoljni mehanizmi koji kontrolišu Open XML format mogu da posluže u cilju sprečavanja nehotične ili zlonamerne razmene podataka na nepredviđeni način. Ta zaštita može da se sprovede u obliku informacija o ličnoj identifikaciji korisnika unutar dokumenta ili u kao komentari koji naglašavaju prirodu poverljivosti dokumenta. Ovi sadržaji mogu da posluže i u druge svrhe: recimo, možete parsirati kolekciju dokumenata i klasifikovati ih prema korisniku ili nameni zapisanoj u nekom svojstvu, arhivirati ih na drugoj lokaciji ili naknadno osvežavati spiskove i opise dokumenata na Web portalu firme. I da ne nabrajamo dalje: i ovaj vrh ledenog brega je dovoljan da razumete dokle dopiru mogućnosti.

Bolje nego što smo očekivali

Da biste bolje razumeli koliku važnost Microsoft pridaje potrebi prihvatanja novih formata datoteka za sledeći Office, neka vam posluži podataka da je već u drugoj nedelji nakon prvog javnog nastupa Bila Gejtsa o Officeu 12 (o čemu ste čitali u prošlom broju) formiran portal na adresi www.microsoft.com/office/preview/default.mspx. Glavni sadržaj na portalu čine dva white paper dokumenta o principima koje čini Open XML Format. Međutim, prilično iznenađenje predstavlja to što je već u ovoj fazi razvoja, bar nekoliko meseci pre prve interne beta verzije Officea 12, formiran blog koji vodi Brian Jones, iskusni program menadžer odeljenja za Word i jedan od glavnih kreatora sadašnje XML funkcionalnosti u Officeu 2003. Već u prvoj dekadi juna, kad potpisnik ovih redova završava ovaj prikaz, bilo je tamo nekoliko pikanterija na kakve nismo navikli. Da li to Microsoft ovim gestom polako napušta praksu teške konspiracije kojom je obavijao razvoj ključnih tehnologija i počinje da sluša glas korisnika? Bilo bi dobro da je tako; u svakom slučaju, ako ste zainteresovani za temu o kojoj je ovde bilo reči, pomenuta adresa će biti vredna posete. Biće ovo vruće leto, izgleda ne samo na termometru.

 

  (C) 2000-2011 Praktikum na Webu

Objavljeno u časopisu PC #113, jula 2005.


 
 

Vrh stranice  Prethodna stranica  Naslovna strana  Mapa sajta  Pretraga

AFORIZAM ZA DANAS OVIH DANA SLUŠAMO...

Copyright © Praktikum na Webu, 2000-2011; Valinor Design; sva prava pridržana.