[ Pobierz całość w formacie PDF ]
Zaawansowane systemy baz danych - ZSBD
Multimedialne bazy danych
Wykład prowadzi:
Marek Wojciechowski
Multimedialne bazy danych
Wykład poświęcony jest problematyce multimedialnych baz danych, ich specyfice oraz
technikom wyszukiwania, składowania i prezentacji danych wykorzystywanym w ich
kontekście.
Podstawowym celem niniejszego wykładu jest zapoznanie studenta z problematyką
multimedialnych baz danych, ze szczególnym naciskiem na opis i wyszukiwanie treści
multimedialnych.
Do zrozumienia treści wykładu niezbędna jest znajomość systemów baz danych i języka SQL.
1
Zaawansowane systemy baz danych - ZSBD
Plan wykładu
• Wprowadzenie: multimedia, podstawowe definicje
• Specyfika systemów multimedialnych baz danych
• Metadane
• Modele danych dla multimedialnych baz danych
• MPEG-7
• Przetwarzanie zapytań w multimedialnych bazach
danych
• Wyszukiwanie w oparciu o zawartość
•Składowanie danych multimedialnych
• Prezentacja i transmisja danych multimedialnych
Multimedialne bazy danych (2)
Wykład rozpocznie się od wprowadzenia do multimediów i przedstawienia podstawowych
definicji. Następnie wskazane będą cechy i wymagania stawiane systemom multimedialnych
baz danych, które odróżniają je od tradycyjnych systemów baz danych. W kolejnej części
wykładu omówione będą metadane, ich klasyfikacja i rola w opisie zawartości multimedialnej.
Kolejny temat to modele danych dla multimedialnych baz danych. Następnie omówiony
będzie standard opisu zawartości multimedialnej MPEG-7. Po nim przedstawiona będzie
problematyka przetwarzania zapytań w multimedialnych bazach danych, ze szczególnym
uwzględnieniem wyszukiwania obrazów w oparciu o zawartość (ang. Content-Based Image
Retrieval). Na zakończenie, krótko nakreślone będą problemy składowania, prezentacji i
transmisji danych multimedialnych, ze wskazaniem rozwiązań stosowanych w tym zakresie.
2
Zaawansowane systemy baz danych - ZSBD
Multimedia – podstawowe definicje
• Obiekt medialny – informacja zrozumiała dla komputera,
zakodowana w jednym medium
– media dyskretne: tekst, obraz
– media ciągłe: audio, wideo
• Obiekt multimedialny – informacja zrozumiała dla
komputera, zakodowana w jednym lub więcej mediów
• Dane multimedialne – zbiór obiektów multimedialnych
• System multimedialny – system komputerowy
wspierający wymianę informacji z użytkownikiem za
pomocą kilku różnych mediów
Multimedialne bazy danych (3)
Obiekt medialny to informacja zrozumiała dla komputera, zakodowana w jednym medium.
Wykorzystywane obecnie media to media wizualne i akustyczne: tekst, obrazy nieruchome,
audio i wideo. Systemy wykorzystujące w komunikacji z człowiekiem zapach, smak i dotyk są
na razie przedmiotem prac badawczych i prototypowych. Z punktu widzenia prezentacji
multimediów istotny jest podział na media dyskretne (niezmienne w czasie, statyczne),
obejmujące tekst i obrazy nieruchome oraz media ciągłe (zmienne w czasie, dynamiczne),
obejmujące audio i wideo.
Obiekt multimedialny to informacja zrozumiała dla komputera, zakodowana w jednym lub
więcej mediów. Często dodawany jest jeszcze warunek, że co najmniej jedno medium
powinno być nie-alfanumeryczne. W zasadzie termin „multimedia”, z racji przedrostka
„multi-”, powinien być używany do opisu danych zakodowanych w więcej niż jednym
medium. W praktyce przyjmuje się jednak, że obrazy czy muzyka w postaci cyfrowej również
stanowią dane multimedialne, gdyż jest to zgodne z odczuciami użytkowników.
Dane multimedialne można najprościej zdefiniować jako zbiór obiektów multimedialnych.
System multimedialny (wg Meyera-Wegenera) to system komputerowy wspierający wymianę
informacji z użytkownikiem za pomocą kilku różnych mediów. W zasadzie brak jest
jednoznacznej, „ostrej”, powszechnie akceptowanej definicji systemu multimedialnego.
Przykładowo, istnieje inna definicja mówiąca, że system multimedialny to system
komputerowy umożliwiający w sposób zintegrowany tworzenie, przetwarzanie, prezentację i
przesyłanie informacji zakodowanych w co najmniej jednym medium ciągłym i jednym
dyskretnym.
3
Zaawansowane systemy baz danych - ZSBD
Charakterystyka typów multimediów (1/2)
• Obrazy
– reprezentowane jako 2-wymiarowa tablica pikseli,
gdzie wartość piksela reprezentuje jego kolor
– zazwyczaj skompresowane (GIF, JPEG, PNG)
•Wideo
– sekwencja klatek prezentowanych w odpowiednim
tempie
– podzielone na segmenty (fizyczne, logiczne)
– zazwyczaj skompresowane (MPEG)
– zazwyczaj uzupełnione o dane audio
Multimedialne bazy danych (4)
Podstawowe typy multimediów to obrazy nieruchome, dane wideo, dane audio i złożone
obiekty multimedialne.
Obrazy są reprezentowane w postaci 2-wymiarowej tablicy pikseli (ang. pixel – picture
element). Wartość przypisana danemu pikselowi reprezentuje jego kolor. Przykładowe liczby
bitów przeznaczanych na zapamiętanie koloru to 8 dla obrazów w skali odcieni szarości i 24
dla obrazów kolorowych. Zazwyczaj obrazy są zapisane w postaci skompresowanej w celu
redukcji ich rozmiaru. Przykładowe formaty to: GIF i PNG (kompresja bez utraty jakości) i
JPEG (kompresja z utratą jakości, wykorzystująca właściwości ludzkiego zmysłu wzroku).
Dane wideo mają postać sekwencji klatek (ang. frame), gdzie każda klatka jest nieruchomym
obrazem. Klatki muszą być prezentowane w odpowiednim ustalonym tempie, np. 25 klatek na
sekundę. Sekwencja wideo może być podzielona na segmenty. Podstawowy podział to podział
na segmenty fizyczne, gdzie każdy segment to sekwencja klatek pochodząca z jednego ujęcia
kamery. Innym możliwym podziałem jest podział na segmenty logiczne reprezentujące
fragmenty wideo o konkretnym znaczeniu. Dane wideo w postaci nieskompresowanej, ze
względu na swój rozmiar, mogą być wykorzystywane jedynie na etapie profesjonalnej
obróbki. Udostępniane użytkownikom w postaci cyfrowej są zawsze skompresowane.
Kompresja wideo wykorzystuje przestrzenną i czasową nadmiarowość danych. Redukcja
nadmiarowości przestrzennej polega na kompresji klatek metodą dla obrazów statycznych (np.
JPEG). Redukcja nadmiarowości czasowej opiera się na reprezentacji niektórych klatek
poprzez zapamiętanie zmian w stosunku do klatki poprzedzającej lub interpolację klatki z
wykorzystaniem jednej klatki poprzedzającej i jednej następującej.
Podstawowe standardy kompresji wideo zostały opracowane przez grupę MPEG (Moving
Pictures Experts Group): MPEG-1 zapewniający jakość porównywalną z VHS,
wykorzystywany w VCD; MPEG-2 wykorzystywany w DVD i telewizji wysokiej
rozdzielczości HDTV; MPEG-4 wykorzystywany w dystrybucji wideo poprzez Internet.
Dane wideo zazwyczaj uzupełnione są o dane audio, tworząc złożony obiekt multimedialny.
4
Zaawansowane systemy baz danych - ZSBD
Charakterystyka typów multimediów (2/2)
•Audio
– cyfrowy zapis muzyki lub mowy
– wynik próbkowania sygnału analogowego (PCM,
MP3) lub dźwięk syntezowany (MIDI)
•Złożone dane multimedialne
– filmy wideo z dźwiękiem (i opcjonalnie napisami)
– prezentacje multimedialne
– poszczególne media zapisane niezależnie lub razem
tworząc nowy format
Multimedialne bazy danych (5)
Dane audio to muzyka i mowa. Mowa jest szczególnym przypadkiem danych audio, którym
towarzyszą inne metadane niż muzyce i często również tekstowy zapis treści. Dane audio w
postaci cyfrowej mogą być wynikiem próbkowania sygnału analogowego (np. z mikrofonu)
albo być syntezowane na podstawie zapisu podobnego do nutowego. Dane będące wynikiem
próbkowania mogą być zapisane w postaci nieskompresowanej (format PCM) lub
skompresowanej (np. MP3 – kompresja z utratą jakości, wykorzystująca właściwości
ludzkiego zmysłu słuchu). Najpopularniejszym formatem dla dźwięku syntezowanego jest
MIDI.
Oprócz samodzielnych obrazów, audio i wideo, w praktyce często występują dane
rzeczywiście multimedialne, czyli zakodowane w kilku różnych mediach. Typowym
przykładem są filmy, w których sekwencji wideo towarzyszy zsynchronizowana z niąścieżka
dźwiękowa, a opcjonalnie też napisy (ang. subtitles). Innym przykładem danych integrujących
wiele mediów są prezentacje multimedialne, gdzie tekstowo-obrazkowym slajdom towarzyszy
dźwięk z komentarzem i opcjonalnie animacje. W przypadku złożonych obiektów
multimedialnych, składające się na nie media mogą być składowane niezależnie lub razem,
tworząc nowy format. Przykładem złożonego formatu jest choćby powszechnie znany format
AVI, w którym przeplecione ze sobą są niezależnie kompresowane wideo i audio.
5
[ Pobierz całość w formacie PDF ]