[ Pobierz całość w formacie PDF ]
Zaawansowane Systemy Baz Danych – ZSBD
Bazy danych dokumentów XML
wykład 1 – wprowadzenie
Wykład przygotował:
Krzysztof Jankiewicz
Bazy danych dokumentów XML
–
wykład 1 – wprowadzenie
Przez ostatnich kilkanaście lat znaczenie formatu danych XML stale rośnie. Popularność XML
wynika z jego prostoty i elastyczności. Te cechy spowodowały, że XML stał się popularnym i
dominującym standardem wymiany danych o złożonej, zmiennej i nieokreślonej strukturze. Dzięki
tym cechom XML jest z powodzeniem wykorzystywany w takich dziedzinach jak: nauka, finanse,
wymiana informacji, medycyna, grafika, kartografia, multimedia itp.
Początkowo dokumenty XML przechowywanie były przy wykorzystaniu systemów plików.
Rosnące znaczenie i popularność XML-a a także stale rosnąca liczba dokumentów XML i
konieczność ich wydajnego przetwarzania spowodowały, że w ostatnim czasie bardzo wiele
komercyjnych systemów zarządzania obiektowymi i postrelacyjnymi systemami baz danych
rozszerzyło swoją funkcjonalność o mechanizmy pozwalające na przechowywanie i przetwarzanie
dokumentów XML. Takie rozwiązania pozwalają w znakomity sposób integrować dane mające
różny charakter, z jednej strony strukturalny (dane obiektowe i relacyjne) z drugiej strony
semistrukturalne (dane w formacie XML). Oprócz adaptacji systemów obiektowych i
posterelacyjnych obserwuje się także powstawanie licznych specjalizowanych rozwiązań pod
postacią baz danych dokumentów XML (ang. native XML database systems). W tego typu bazach
danych podstawową jednostką informacji jest dokument XML, użytkownicy przechowują w nich
swoje dokumenty XML, przeglądają ich zawartość, generują na podstawie zawartości bazy
danych nowe dokumenty XML.
Z punktu widzenia klasyfikacji, bazy danych dokumentów XML są przykładem semistrukturalnych
baz danych.
1
Zaawansowane Systemy Baz Danych – ZSBD
Plan wykładu
• Typy dokumentów XML i ich wpływ na bazy danych
•Języki zapytań służące przetwarzaniu dokumentów XML
• Definicja bazy danych dokumentów XML
• Funkcjonalność baz danych dokumentów XML
• Sposoby przechowywania dokumentów XML
• Mechanizmy przetwarzania dokumentów
–języki zapytań
– sposoby modyfikacji
Bazy danych dokumentów XML – wykład 1 – wprowadzenie (2)
Informacje dotyczÄ…ce XML-owych baz danych zostanÄ… przedstawione w trzech kolejnych
wykładach.
Wykład pierwszy będzie wprowadzeniem do tematyki XML-owych baz danych. Zostanie
przedstawiona definicja, funkcjonalność oraz typy XML-owych baz danych. Dodatkowo zostaną
omówione te cechy XML-owych baz danych, które wyróżniają je na tle systemów relacyjnych i
obiektowych.
Zadaniem wykładu drugiego będzie przedstawienie języka XQuery jako jednego z najbardziej
zaawansowanych i najbardziej popularnego z języków zapytań stosowanych w XML-owych baz
danych. Omówiona zostanie jego składania oraz funkcjonalność. Wykład zostanie zilustrowany
szeregiem przykładów i porównań.
Wykład trzeci głównie będzie dotyczył języków przeznaczonych do modyfikacji dokumentów XML
w XML-owych bazach danych. Ze względu na to, że nie ma obecnie standardu takiego typu
języka, zostanie przedstawionych kilka podstawowych propozycji stosowanych w różnych bazach
danych dokumentów XML.
W dzisiejszym wykładzie omówimy typy dokumentów XML i ich wpływ na bazy danych. Omówimy
języki zapytań służące przetwarzaniu dokumentów XML. Zostanie przedstawiona jedna z
możliwych definicji baz danych dokumentów XML. W dalszej części wykładu zostanie mówiona
funkcjonalność baz danych dokumentów XML, sposoby przechowywania i mechanizmy
przetwarzania dokumentów XML.
2
Zaawansowane Systemy Baz Danych – ZSBD
Typy dokumentów XML
• Zorientowane na dokumenty tekstowe
– zawierają elementy o składowych mieszanych
(węzłach elementów i węzłach tekstowych)
– z reguły nie mająściśle określonej struktury
– tworzone ze źródeł niestrukturalnych lub przez
człowieka
• Zorientowane na dane
– zawierają elementy zawierające węzły tekstowe lub
elementy wewnętrzne
– z reguły struktura jest z góry określona
– tworzone zwykle ze źródeł strukturalnych
Bazy danych dokumentów XML – wykład 1 – wprowadzenie (3)
Typ, budowa i funkcjonalność bazy danych dokumentów XML uzależniona jest ściśle od typów
dokumentów XML jakie będą w niej przechowywane.
W tym kontekście wyróżnia się dwa typy dokumentów XML:
Po pierwsze, dokumenty zorientowane na dokumenty tekstowe. Tego typu dokumenty zwykle
zawierają elementy o składowych mieszanych (węzły elementów i węzły tekstowe jednocześnie).
Ponadto, tego typu dokumenty, z reguły, nie mająściśle określonej struktury, nie ma narzuconego
schematu, który ogranicza i definiuje strukturę dokumentu. Jest ona indywidualna dla każdego
dokumentu. Często dokumenty takie są tworzone ze źródeł niestrukturalnych takich jak
dokumenty tekstowe, dokumenty HTML. Mogą też być tworzone w sposób nieautomatyczny przez
człowieka.
Drugim typem dokumentów XML są dokumenty zorientowane na dane. Tego typu dokumenty
zawierają elementy, których składowe sąściśle określone. Są to albo węzły tekstowe albo
elementy wewnętrzne. Z reguły, struktura tego typu dokumentów zorientowana jest na
przechowywanie danych, jest ona też z góry określona. Struktura ta wynika najczęściej ze
struktury lub możliwości źródła pochodzenia informacji zawartej w dokumencie. Ponadto, tego
typu dokumenty są zwykle tworzone ze źródeł strukturalnych takich jak bazy danych obiektowe,
relacyjne itp.
3
Przykład dokumentu
zorientowanego na informacjÄ™ tekstowÄ…
<OpisSpotkania>
Dnia <DataSpotkania>01.05.2006</DataSpotkania>
o godzinie <GodzSpotkania>09:15</GodzSpotkania>
mam umówione spotkanie w miejscowości
<MiejsceSpotkania>Zakopane</MiejsceSpotkania>,
hotelu <MiejsceSpotkania>Kasprowy</MiejsceSpotkania>
</OpisSpotkania>
Bazy danych dokumentów XML – wykład 1 – wprowadzenie (4)
Na slajdzie przedstawiono przykładowy dokument zorientowany na informację tekstową.
Element OpisSpotkania jest typowym przykładem elementu mieszanego, zawierającego w swoim
wnętrzu zarówno węzły tekstowe (przykładowo węzeł z tekstem "Dnia ") jak i węzły będące
podelementami (przykładowo element DataSpotkania). Można założyć, że inne dokumenty
posiadające elementy opisujące spotkanie mogą mieć różną od powyższego przykładu
zawartość. Dla przykładu element OpisSpotkania może w ich przypadku mieć tylko jeden
podelement MiejsceSpotkanie, może nie mieć podelementów takich jak DataSpotkania lub
GodzSpotkania (bo dla przykładu nie są one jeszcze znane). Ponadto element MiejsceSpotkania
może być złożony z dodatkowych podelementów, dla przykładu, Miejscowość, Ulica,
KodPocztowy itp.
4
Zaawansowane Systemy Baz Danych – ZSBD
Przykład dokumentu
zorientowanego na dane
<EMP>
<EMPNO>7369</EMPNO>
<ENAME>SMITH</ENAME>
<JOB>CLERK</JOB>
<MGR>7902</MGR>
<HIREDATE>17.12.1980</HIREDATE>
<SAL>800</SAL>
<DEPTNO>10</DEPTNO>
</EMP>
Bazy danych dokumentów XML – wykład 1 – wprowadzenie (5)
Na tym z kolei slajdzie przedstawiono dokument zorientowany na dane. Informacje w nim zawarte
mogą pochodzić z bazy danych relacyjnej lub obiektowej. Dokument ma wyraźną bardzo ściśle
określoną budowę.
Element ROW składa się tylko z podelementów. Nie ma bezpośrednich żadnych podwęzłów
tekstowych. Podelementy elementu ROW, w przypadku dokumentu ze slajdu, sÄ… elementami
prostymi. Ich zawartość jest prosta, może ona pochodzić z atrybutów tabeli lub obiektu. Można
założyć, że budowa innych elementów EMP będzie bardzo podobna, każdy z nich będzie się
składał z podelementów prostych wśród, których znajdą się elementy takie jak EMPNO czy
ENAME.
5
Zaawansowane Systemy Baz Danych – ZSBD
[ Pobierz całość w formacie PDF ]