Home

Volltextdokument

image

Contents

1. 149 5 Teilanwendung 2 AdminTools Zu den weiteren Besonderheiten des Entwurfes der Teilanwendung AdminTools geh rt auch die Integration einer Reihe von externen API s die notwendig sind um die gew nschten Funktionalit ten der Anwendung zu realisieren So werden etwa der E Mail basierte Metadatenexport nach DDB oder der FTP basierte Export nach SWB mit Hilfe solcher in die Anwendung integrierter Bibliotheken realisiert die hier allerdings nicht im Detail beschrieben werden sollen Einige Informationen zu den verwendeten APT s finden sich im Anhang im Kapitel D 150 5 2 Realisierung 5 2 Realisierung Dieser Abschnitt soll die Realisierung der Teilanwendung AdminTools anhand von einigen Screenshots n her erl utern Der Abschnitt unterteilt sich dabei in zwei Bereiche im ersten wird der Teil der AdminTools beschrieben der die Arbeitsabl ufe der Gesch ftsmodelle nachbildet Der zweite Teil bezieht sich auf die Bereiche die administrative T tigkeiten in Bezug auf das Gesamtsystem unterst tzen Auch die Teilanwendung Admin Tools verwendet zum gr ten Teil das in der Belegarbeit erstellte Layout welches in n her beschrieben ist 5 2 1 Unterst tzung der Arbeitsabl ufe Die Teilanwendung AdminTools hat einen gro en Einfluss auf das Gesamtsystem und insbesondere den Zugriff auf alle Metadaten des Systems so dass sie nur einem ausge w hlten Personenkreig zur Verf gung stehen sollte
2. 152 5 2 Realisierung Button FUNKTION Dokument Zeigt alle dokumentenspezifischen Informationen f r den jeweiligen Me tadatensatz an So kann hier auch der Dokumenten Zustand des Meta datensatzes ver ndert werden Bearbeiten Hier k nnen alle Metadaten des Metadatensatzes bearbeitet hinzuge f gt und validiert werden Einer der zentralen Bereiche dieser Teilan wendung Drucken Es erfolgt eine druckfreundliche Pr sentation von Teilen der Metadaten die somit gedruckt und an den entsprechenden Fachreferenten verschickt werden k nnen R cksetzen Im Falle der datenbankbasierten Persistenz in der Konfigurationsdatei web xml einstellbar kann der Metadatensatz auf seinen urspr nglichen Stand zur ckgesetzt werden so dass wieder genau die Angaben des Autors enthalten sind Export DDB Hier erfolgt die automatische Konvertierung des Metadatensatzes in das von der DDB erwartete Format und der eigentliche Export Export SWB Hier erfolgt die automatische Konvertierung des Metadatensatzes in das von der SWB erwartete Format und der eigentliche Export L schen L scht den selektierten Metadatensatz nach vorheriger Warnung Der Metadatensatz ist damit endg ltig nicht mehr verf gbar Einstellen Beginnt mit der Einstellung des selektierten Metadatensatzes ein mehr stufiger Prozess falls dieser alle Voraussetzungen daf r erf llt siehe dazu auch Abschnitt 5 1 Tabelle 9 Bearbeitungsm glichkeiten von Metadatens
3. 30 2 3 R ckblick auf den Gro en Beleg 2 2 2 2 33 2 3 1 Anforderungen und Ergebnisse der Belegarbeit 33 2 4 1 Open Archives Initiative OAD 38 2 4 1 1 Protocol for Metadata Harvesting 40 2 4 2 Deutsche Initiative f r Netzwerkinformationen DIND 44 2 4 2 1 Ziele der Arbeitsgruppe Elektronisches Publizieren 45 2 4 2 2 Anforderungen an einen Hochschulschriftenserver 46 2 4 2 3 Einsch tzung und Wertung 50 han dob Satis w ee BAe Oe Ge 50 2 4 3 1 Dissertation Markup Language DiML 51 2 4 4 Subjektive Einsch tzung der betrachteten Initiativen und EE 55 27 2 Aufgabenstellung Grundlagen Arbeitsabl ufe 2 1 Aufgabenstellung der Diplomarbeit Der Autor dieser Diplomarbeit hat in einem Gro en Beleg der dieser Arbeit inhalt lich vorausging ein System f r die bergabe von Hochschulschriften an die SLUB erstellt Auf der Basis dieses Systems ist nun ein neuer Baustein zu konzipieren und zu erstellen der auch die Nutzung der Schriften ber das Web erm glicht Dazu ist der zweite Teil der schon vorliegenden Anwendung in der die SLUB die von den Au toren bergebenen Daten pr ft und sie um eigenen Verwaltungsdaten erg nzt noch einmal zu berarbeiten und an die neuen Aufgaben anzupassen Insbesondere soll der Einsatz eines Datenbanksystems f r die Metadaten erfolgen Es ist ein geeignetes Datenbankverwaltung
4. Auch f r den Export ist eine Bedingung zu erf llen n mlich dass die zu exportie renden Metadaten vollst ndig sind was bei Erreichen des Metadatenzustandes Vali dierung Sekund rmetadaten OK gegeben ist Erst dann wird ein Export innerhalb der AdminTools zugelassen Die vollst ndigen Voraussetzungen f r ein m gliches Ein stellen eines Metadatensatzes in die persistente Datenbasis des Gesamtsystems ange zeigt durch den Gesamtzustand Vorgang abgeschlossen k nnen jetzt also wie folgt angegeben werden e f r die Dokumentenart Dissertation Metadatenzustand Validierung Sekund rmetadaten OK Dokumentenzustand Dokument OK Exportzustand DDB Metadaten exportiert bzw OK R ckmeldung Exportzustand SWB Metadaten exportiert bzw OK R ckmeldung e f r die Dokumentenart Bericht Metadatenzustand Validierung Sekund rmetadaten OK Dokumentenzustand Dokument OK Exportzustand SWB Metadaten exportiert bzw OK R ckmeldung W nschenswert aber eben nicht notwendig w re es dass mit der Einstellung des Metadatensatzes solange gewartet wird bis der Exportzustand f r jeden ben tigten Export dem Zustand OK R ckmeldung entspricht 3Bei dem Erhalt einer solchen Best tigung w rde der Bearbeiter den Exportzustand auf OK R ckmeldung setzen Daf r w rde die Anwendung auch wieder den Zeitpunkt mitprotokollieren
5. besteht aus dem eigentlichen Inhalt des Dokuments und ist vom Verfasser in mehre ren Ebenen gliederbar Gliederungsstufen sind Kapitel lt chapter gt Unterkapitel lt section gt Abschnitt lt subsection gt Unterabschnitt lt block gt Unterunter abschnitt lt subblock gt und Part lt part gt lt front gt lt school gt Institut f r Klinische Psychologie lt p gt der Fachrichtung Psychologie lt p gt der Fakult t Mathematik und Naturwissenschaften lt p gt der Technische Universit t Dresden lt p gt lt school gt lt submission gt Dissertation lt submission gt lt title gt Unerw nschte Gedanken bei Angstst rungen lt title gt lt degree gt zur Erlangung des akademischen Grades lt br gt doctor rerum naturalium Dr rer nat lt degree gt lt major gt vorgelegt der Fakult t Mathematik und Naturwissenschaften lt br gt der Technischen Universit t Berlin lt major gt lt author gt von lt given gt Lydia Birgit lt given gt lt surname gt Fehm lt surname gt lt suffix gt 06 06 1966 geboren in lt suffix gt lt author gt lt dean gt Dekan Prof Dr Mustermann lt dean gt lt approvalls gt lt name gt Prof Dr B Tuschen Caffier lt name gt lt name gt Prof Dr med J Margraf lt name gt lt approvalls gt lt date type 2 gt eingereicht 02 07 1999 lt date gt lt date type 2 gt Datum der Promotion 19 12 1999 lt date gt lt german
6. 5080 w re eine solche Realisierung insbesondere f r die Teilanwendung AdminTools interessant weil es sich hier um die mit Abstand komplexeste Schnittstelle handelt die au erdem in den Punkten Performance und Stabilit t unter Umst nden stark dazugewinnen k nnte Auch die alternative Realisierung des MetadatenGenerators w rde auf diesem Wege Sinn machen das gilt jedoch kaum f r die dritte Teilanwendung Access Tools 113 3 Systemarchitektur 3 3 4 1 Schema und Datenbankanforderungen Dadurch dass die Datenbank laut Aufgabenstellung lediglich die Metadatens tze zu den einzelnen Hochschulschriften und nicht notwendigerweise die Dokumente selbst enthalten soll sind die Anforderungen an das noch zu spezifizierende Schema und damit auch an die Datenbank sehr moderat Insbesondere liegen die Wertebereiche der Informationen die in den Metadatens tzen enthalten sind im Bereich konventioneller Datentypen wie sie in nahezu allen Datenbanken existieren Ein Kriterium welches die Auswahl an Datenbankverwaltungssytemen m glicher weise ein wenig mehr einschr nkt ist die zu fordernde Unterst tzung von Transaktio nen Schon in diesem fr hen Stadium des Entwurfs ist absehbar dass einige Daten bankoperationen mit Sicherheit innerhalb einer Transaktion ablaufen m ssen so zum Beispiel das L schen des tempor ren Metadatensatzes und das Einstellen desselben in die endg ltig persistente Datenbasis des Gesamtsystems Ein n c
7. 109 a e E bc BS Aes ee 118 ee er ee 122 1 Abbildung 33 HSSS Package metadataset Ausschnitt 126 Abbildung 34 SLUB MetadatenGenerator Formular 1 129 SLUB MetadatenGenerator Hilfe Abbildung 36 SLUB MetadatenGenerator Formular 2 131 Abbildung 37 SLUB MetadatenGenerator bersicht 132 Abbildung 38 SLUB MetadatenGenerator Fragebogen Ausschnitt 137 LUB MetadatenGenerator Bearbeitungsstatus Abbildung 41 HSSS AdminTools bersicht der Metadatens tze 152 Abbildung 42 HSSS AdminTools Die Metadaten eines Metadatensatzes 154 Abbildung 44 HSSS AdminTools Export nach DDB Abbildung 45 HSSS AdminTools tempor re Metadaten Zust nde 10 Abbildungsverzeichnis gt Admin Tools Einstellen des Metadatensatzes 159 Abbildung 47 HSSS AdminTools Benutzerverwaltungl e 163 DEREN 161 ER 167 ee ee 168 Abbildung 51 Grundlegende Schemastruktur 3 169 182 Gaye natu sie en ei 184 seepage peg oa 189 Abbildung 55 HSSS Package lucene oono aaa 191 TEE 197 Don d n poi 198 ETTET 199 AA 200 Abbildung 60 myH555 gesammelte Treffer 2 2 2 2 ee 201 EEN 202 O ce et ee ee a ik re a 210 o 215 Abbildung 64 OAI Repository Explorer Anzeige eines Records 216 AAA 217 11 Tabellenverzeichnis 37 63 Tabelle 3 Einflussm glichkeiten der Metadatensa
8. pers_date Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV v y eindeutige Identifikationsnummer f r die Tabelle date datetime VJ Datum unique date Tabelle A66 die Tabelle pers_date pers_description Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV v vy eindeutige Identifikationsnummer f r die Tabelle description text Beschreibung Abstract language_id numeric 5 Y die Sprache der Beschreibung Fremd schl ssel Language_id references pers_language id Tabelle A67 die Tabelle pers_description pers_format Name DATENTYP M BESCHREIBUNG I P id numeric 6 vV v X eindeutige Identifikationsnummer f r die Tabelle extension varchar 20 y Erweiterung des Dokumentenformats mimetype varchar 100 VW Mime Typ name varchar 100 gebr uchliche Bezeichnung des Formats description varchar 255 optionale Beschreibung unique extension Tabelle A68 die Tabelle pers_format 267 C Datenbank Schema des HSSS pers_kindofdocument Name DATENTYP I P M BESCHREIBUNG id numeric 4 vV v y eindeutige Identifikationsnummer f r die Tabelle name varchar 100 y Bezeichnung der Dokumentenart description varchar 255 optionale Beschreibung Tabelle A69 die Tabelle pers_kindofdocument pers_language Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle name varchar
9. A 2 5 DC PUBLISHER Bezeichnung NAME DER UNIVERSITATSBIBLIOTHEK Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation Haufigkeit Langenrestriktion Name der Institution die fiir die Verbreitung bzw die Bereitstel lung der Hochschulschrift verantwortlich ist DC Publisher CorporateName dc_ publisher _corporatename secondary mandatory 1 1 10 255 Tabelle A18 HSSS Metadatensatz Name der Universit tsbibliothek Bezeichnung ADRESSE DER UNIVERSIT TSBIBLIOTHEK Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Adresse der Institution die f r die Verbreitung bzw die Bereit stellung der Hochschulschrift verantwortlich ist DC Publisher CorporateName Address dc_publisher_corporatename_ address secondary mandatory 1 1 10 255 Tabelle A19 HSSS Metadatensatz Adresse der Universit tsbibliothek 236 A 2 Spezifikation der Metadaten A 2 6 DC CONTRIBUTOR Bezeichnung NAME DER UNIVERSITAREN EINRICHTUNG Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Name der Institution die f r die Erstellung bzw die Bewer tung der Hochschulschrift verantwortlich ist Universit t Fakul t t Fachbereich Institut DC Contributor CorporateName de _contributor _corporatename primary mandatory 1 1 20 255 Tabelle A2
10. Dokument vorhanden Das Dokument ist vorhanden befindet sich physisch auf einem der Rechner der SLUB Mitarb des Referats 5 3 Validierung Dokument Die elektronische Version des Dokumentes wird mit dem Druckexemplar stichprobenartig verglichen Validierung Dokument OK Die elektronische Version des Dokumentes konnte korrekt validiert werden Validierung Dokument Fehler Die elektronische Version des Dokumentes konnte nicht korrekt validiert werden Das erhaltene Dokument war feh lerhaft Konvertierung Dokument Das Format des Dokumentes wird in das Zielformat HSSS Pr sentationsformat konvertiert Konvertierung Dokument OK Die elektronische Version des Dokumentes konnte korrekt konvertiert werden Konvertierung Dokument Feh Die elektronische Version des Dokumentes konnte nicht ler korrekt konvertiert werden Das erhaltene Dokument war fehlerhaft Dokument OK Endzustand f r Dokumente Dokument ist validiert kon vertiert und liegt im vorgesehenen Verzeichnis aber noch nicht im Frontdoor Verzeichnis Tabelle 6 Dokument spezifische Zust nde nicht nach au en au erhalb der Admin Tools sichbar 2die elektronische Version der Hochschulschrift in m glicherweise mehreren Formaten 146 5 1 Analyse und Design Die Zust nde begleiten die wesentlichen sich aus den spezifizierten Arbeitsabl ufen ergebenden Aktionen im Zusammenhang mit Dokumenten das formale stichproben artige Vergleichen mit der entspre
11. Dokumentation der Do kumenttypdefinition Dissertation Markup Language Projekt Digitale Dissertationen der Humboldt Universit t zu Berlin 2000 288 Literaturverzeichnis SWB00 TuP00 V1i99 WiK99 Wil99 Wis01 WLB97 SWB Arbeitspapier Arbeitshilfe fuer die Bearbeitung von in den SWB eingespielten Metadaten SWB Arbeitspapier Stand 31 10 2000 Volker Turau Ronald Pfeiffer Java Server Pages dpunkt 2000 John Vlissides Entwurfsmuster anwenden Addison Wesley 1999 Gerhard Wilhelms und Markus Kopp Java professionell mitp 1999 Alan R Williamson Java Servlets By Example Manning 1999 Wissenschaftsrat Empfehlungen zur digitalen Informationsversorgung durch Hochschulbibliotheken Wissenschaftsrat 2001 Hakon Wium Lie and Bert Bos Cascading Style Sheets Addison Wesley 1997 289 L AP L DB L DC L DGf L DF L Dla L Di L DIb L DOI L IUK L JA Linkverzeichnis Apache Software Foundation ASF http www apache org Dokumentenserver Der Deutschen Bbliothek http deposit ddb de Dublin Core http purl org DC Deutsche Gesellschaft f r Erziehungswissenschaft http www dgfe de Deutsche Forschungsgemeinschaft DFG http www dfg de Deutsche Initiative f r Netzwerkinformationen DINI http www dini de DiML2 0 DTD http dochost rz hu berlin de epdiss software diml2_0 dtd DINI A
12. MetadataSet Entity Abbildung 49 Grundlegende Schemastruktur 1 Die Realisierung erfolgt dabei auf zwei verschiedene Arten zum einen direkt inner halb der pers_metadataset Relation f r pro Metadatensatz eindeutige Attribute wie 23Dies galt zum Beispiel f r die in Abschnitt 4 3 betrachteten Relationen nicht die f r die st ndige Bearbeitung bereits strukturierter Daten optimiert waren und als Attribute daher auch komplexe XML Strukturen zulie en die ihrerseits wieder aus hierarchisch strukturierten atomaren Attribu ten bestanden 167 5 Teilanwendung 2 AdminTools etwa der Bearbeitungsnummer processingid der absoluten URL identifier_vir tuel oder der realen URL identifier_real zum anderen ber Fremdschl ssel die zu seperaten Relationen f hren f r nicht pro Metadatensatz eindeutige Attribute Da zu z hlen z Bsp die Sprache der Hochschulschrift Language d der Dokumenten typ type_id oder die rechtlichen Bedingungen rights_id Diese wurden deshalb ausgelagert um Redundanzen innerhalb der Relation pers_metadatset vermeiden zu k nnen Das Attribut id ist der Prim rschl ssel der Relation und bei der Defini tion als identity gekennzeichnet worden was den Datenbankserver dazu veranlasst f r einen innerhalb der Relation eindeutigen Wert zu sorgen Zwar existieren in dieser Relation mit processingid und auch identifier_virtual bzw identifier_real noch andere Schl sselkandidaten allerdings
13. NACHTEILE Einer der gravierendsten Nachteile dieser Technologie ist der dass f r jeden Zugriff ein neuer externer im Sinne von au erhalb des Webservers Prozess gestartet wird was zu einem instabilen Systemverhalten bei hohen Zugriffs raten mit dementsprechend schlechter Performance f hrt Au erdem ist die Aufrufsementik hinter CGI antiquiert und undurchsichtig so dass sich diese Technologie falls berhaupt allenfalls f r kleine bis mittlere Webanwen dungen eignet 38 Apache Modul modjk 39Details zu diesem Thema finden sich im Abschnitt ab Seite 40 Am H ufigsten ist die Integration von Perl verbreitet 97 3 Systemarchitektur e CGI Erweiterungen Hierbei handelt es sich um proprit re Erweiterungen von CGI welche die be schriebenen Nachteile von CGI mildern sollen VORTEILE Die beschriebenen CGI Nachteile k nnen etwas abgemildert werden insbe sondere was das Prozessverhalten bei parallelen Zugriffen betrifft NACHTEILE Diese Erweiterungen sind in der Regel auf einen bestimmten Webserver zugeschnitten und zum Teil auch plattformabh ngig Dadurch besteht die Gefahr einer gewissen Abh ngigkeit vom entsprechenden Hersteller e Active Server Pages ASP Active Server Pages ASP wurden von Microsoft entwickelt und beinhalten eine Kombination von HTML Teilen und speziellen ASP Teilen im Quellcode Au erdem erlauben sie die Integration externer Objekte ber Techniken wie u a COM DCOM und
14. 7 lt type gt doctoral lt type gt 8 lt identifier gt http hsss slub dresden de hsss servlet hsss urlmapping MappingServlet id 99010018976 5678 19 lt identifier gt 20 lt de gt 21 lt metadata gt 22 lt about gt 23 lt ea xmlns http hsss slub dresden de eprints about 24 xmlns xsi http www w3 org 2000 10 XMLSchema instance 25 xsi schemaLocation http hsss slub dresden de eprints about 26 http hsss slub dresden de eprints about xsd gt 27 lt archive gt SLUB HSSS Archive lt archive gt 28 lt usage gt Metadata may be used without restrictions as long as the OAI 29 identifier remains attached to it lt usage gt 30 lt ea gt 31 lt about gt Listing 1 Record Struktur des OAI Protokolls Listing 1 zeigt verk rzt die Struktur eines fiktiven Record f r den HSSS Hier handelt es sich um eine Dissertation zu einem physikalischen Thema Der Header Abschnitt enth lt den f r die Bearbeitung durch das OAI Protokoll notwendigen Un ique Identifier der zum Teil aus dem Metadaten Identifier besteht au erdem ein Datestamp Der Metadata Teil enth lt Metadaten zu der fiktiven Dissertation die lediglich im Metadatenformat DC Dublin Core beschrieben sind Dies stellt die Minimall sung dar Optional k nnten die Metadaten zu diesem Dokument im Me tadata Abschnitt durch eine Reihe weiterer Metadatenformate beschrieben werden Der optionale About Abschnitt besteht aus der Bezeichnung d
15. ENEE ua nee a dake Be are Eh O E E die er 3 2 Architektur bersicht RER A u Sh ee e e 3 2 2 Vorgehensweise Priorisierung e 3 3 ArchitekturdetallS 3 3 1 Architekturbesonderheitedl 3 3 1 1 Bearbeitungsnummer 3 3 1 2 Konfigurationsstrukturen Sara A ew eS 3 3 2 1 Technologische Alternativen 3 3 2 2 Objektorientierte Analyse und Design 3 3 2 3 Architektur und Entwurfsmuster 3 3 3 Architekturdetails auf Client Ebenel 3 3 3 1 Einordnung in die Gesamtarchitektur 3 3 3 2 Technologische Alternativen 3 3 4 Architekturdetails auf Datenbank Ebenel 3 3 4 1 Schema und Datenbankanforderungen 3 3 4 2 Datenbank Evaluation 3 3 4 3 Design der Schnittstelle 61 3 Systemarchitektur 3 1 Gesch ftsmodelle und Arbeitsabl ufe Dieser Abschnitt soll alle im Zusammenhang mit dem HSSS stehenden Arbeitsabl ufe analysieren und detailliert beschreiben noch bevor im weiteren Verlauf des Kapitels mit der technischen Analyse und dem Design der Systemarchitektur begonnen wird F r die Entwicklung von kundenorientierter Software und insbesondere f r die sp tere Akzeptanz und Effektivit t der Anwendungen ist es unabdingbar die vorhandenen Ar beitsabl ufe und Prozesse zu analysieren und nach M glichkeit zu
16. bezeichnet Das Zeichen bedeutet JA bedeutet NEIN e P Steht f r Primary Key Prim rschl ssel Bedeutet dass der Wert dieser Spalte das zugeh rige Tupel innerhalb der Tabelle eindeutig beschreibt Das Zeichen y bedeutet JA bedeutet NEIN e M Steht f r Mandatory erforderlich Bedeutet dass ein Wert in dieser Spalte verlangt wird bzw dass kein Null Wert erlaubt ist Das Zeichen bedeutet JA NOT NULL bedeutet NEIN NULL e Beschreibung Beschreibt Besonderheiten z Bsp Wertebereich oder Funktion der jeweiligen Spalte falls erforderlich Die Namen der Relationen wurden in der Regel aus der englischen bersetzung des jeweiligen Gegenstandsbreiches und einem Prefix erstellt dabei sind die in Tabelle A55 gezeigten Prefix Namen f r Relationen verwendet worden 260 C 1 berblick Prefix BESCHREIBUNG pers steht f r persistent und ist in allen Relationen enthalten die zur persistenten Speicherung der Metadatens tze notwendig sind temp steht f r temporary und ist in allen Relationen enthalten die tempor re Metada tens tze enthalten stat steht f r statistic und ist in allen Relationen enthalten die statistische Informatio nen enthalten config steht f r configuration und ist in allen Relationen enthalten die XML basierte Konfigurationsstrukturen enthalten Tabelle A55 Bedeutung der Relationen Prefixe Tabell
17. getLabel O getDescription getMinFrequency getMaxFrequency usw zur Verf gung ValidationInformation enth lt eine Datenstruktur in der abgelegt ist welche Ele mente bzw Sub Elemente bereits wie validiert wurden Sin diesem Fall um die Sub Elemente DC Contributor Advisor Betreuer und DC Contributor Advisor Gutachter siehe dazu auch Abschnitt 4 2 im Anhang 7d h die Klasse MetadataSet ruft in ihrer Implementation von createNode die createNode Methode der Klasse jeder enthaltenen Dublin Core Kategorie auf und setzt die Einzelstrukturen zu einer Gesamtstruktur zusammen 127 4 Teilanwendung 1 MetadatenGenerator Die Aktionen des MetadatenGenerator auf der Ebene dieses Packages bestehen also darin Parameter entgegenzunehmen danach diejenigen herauszufiltern die Infor mationen zu Metadaten enthalten und diese Parameter mit Hilfe der zur jeweiligen MetadataSet Klasse geh renden MetadataValidator Klasse zu validieren Gleichzei tig wird das MetadataSet Objekt bzw dessen Aggregate aktualisiert zus tzlich auch die Datenstruktur innerhalb von ValidationInformation Dies geschieht solan ge bis der Metadatensatz vollst ndig ist im Sinne der prim ren Metadaten Anschlie Bend wird die zugeh rige XML Struktur erzeugt durch die jeweiligen createNode Methoden und tempor r dateibasiert oder datenbankbasiert gespeichert 8dies ist deshalb m glich weil die Parameternamen in der Meta
18. gt lt keywords language de gt lt keyword gt Angstst rungen lt keyword gt BONA SG GO Ma OO oO DD DU O D NOW Zo N HH HH bb H H CO o MAN OTA PWN ra O lt keywords gt lt english gt lt keywords language en gt lt keyword gt anxiety disorders lt keyword gt BONE ERR 36 lt keywords gt 37 lt abstract language de gt 38 lt p gt Die vorliegende Arbeit besch ftigt sich mit der Diagnostik unerw nschter lt p gt 39 lt abstract gt 40 lt abstract language en gt 41 lt p gt The work conducted aimed at evaluating instruments investigating lt p gt 42 lt abstract gt 43 lt front gt Listing 3 Struktur eines Deckblattes in DiML berschriften werden in jeder Gliederungsebene durch lt head gt ausgezeichnet In den einzelnen Gliederungsbestandteilen ist jeweils die selbe Binnenstruktur verf gbar bestehend aus lt p gt Absatz lt citation gt bibliographische Referenz lt table gt Tabellenstrukturen und lt mm gt Multimediaobjekte Au erdem sind mathemati sche Formeln Fu noten Endnoten und Links sowie Listen beschreibbar Auch f r 93 2 Aufgabenstellung Grundlagen Arbeitsabl ufe spezielle Auszeichnungen bzw Formatierungen oder Hervorhebungen innerhalb des Textes existieren Tags zur entsprechenden Beschreibung Die Anh nge stellen den dritten Hauptbestandteil eines DiML Dokuments dar und bestehen aus den Elementen lt bibl
19. liefert alle Titel f r die Indexerstellung liefert alle Schlagworte Klassifikationen f r die Indexerstel lung liefert alle Beschreibungen Abstracts f r die Indexerstellung liefert alle Autoren f r die Indexerstellung liefert alle Betreuer f r die Indexerstellung liefert alle Gutachter f r die Indexerstellung liefert das Ver ffentlichungsdatum f r die Indexerstellung liefert den Dokumententyp f r die Indexerstellung Tabelle A58 bersicht der gespeicherten Prozeduren Teil 1 263 C Datenbank Schema des HSSS gespeicherte Prozedur BESCHREIBUNG processingstate_information oai_title oai_title_more oai_subject oai_creator oai_date oai_type oai_description oai_format oai_language oai_contributor oai_publisher oai_rights oai_identifier oai_relation oai_identifier_exists oai_identifiers liefert alle relevanten Informationen f r die Bearbeitungs status Anwendung des MetadatenGenerators liefert den Originaltitel f r einen gegebenen OAI Identifier liefert alternative und bersetzte Titel f r einen gegebenen OAT Identifier liefert alle Schlagworte Klassifikationen f r einen gegebenen OAI Identifier liefert alle Autoren f r einen gegebenen OAI Identifier liefert das Ver ffentlichungsdatum f r einen gegebenen OAI Identifier liefert den Dokumententyp f r einen gegebenen OAI Identifier liefert die Beschreibungen Abstracts f r einen g
20. unique metadataset id description id Tabelle A83 die Tabelle pers_description_metadataset pers_format_metadataset Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle type varchar 100 vi Typ des Formats Abgabeformat Ori ginalformat etc metadataset_id numeric 6 Y Metadatensatz Fremdschl ssel format_id numeric 6 y Format Fremdschliissel metadataset_id references pers_metadataset id format_id references pers_format id unique metadataset id format id Tabelle A84 die Tabelle pers_format_metadataset 272 C 2 Schema pers_person_metadataset Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle type varchar 100 WJ Typ Rolle der Person Autor Gutach ter etc metadataset_id numeric 6 y Metadatensatz Fremdschl ssel person_id numeric 6 Y Person Fremdschl ssel metadataset_id references pers_metadataset id person_id references pers_person id unique metadataset id person id Tabelle A85 die Tabelle pers_person_metadataset pers_publication_metadataset Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle metadataset_id numeric 6 Y Metadatensatz Fremdschl ssel publication_id numeric 6 y Publikation Fremdschl ssel metadataset_id references pers_
21. vergleichen Erstellung der Sekund r Metadaten SWB Fachreferent Metadatenexport Metadaten persistent einstellen DDB Abbildung 4 Anwendungsfalldiagramm Kontext des Systems f r das Referat 5 3 Abbildung 4 zeigt die in erster Linie mit dem Referat 5 3 verbundenen Anwen dungsf lle Als erstes werden die vom Autor bermittelten Metadaten validiert Dann werden die vom Autor gelieferten Dokumente Druckexemplare und elektronische Ver sion berpr ft indem die Druckexemplare stichprobenartig auf Vollst ndigkeit und die digitale Version auf formale bereinstimmung mit der Druckvorlage kontrolliert wird Bei diesen beiden Anwendungsf llen ist nat rlich auch der Autor als Akteur involviert der gegebenenfalls ber Ergebnisse informiert wird Als n chstes werden die sekund ren Metadaten vom entsprechenden Fachreferenten in Zusammenarbeit festzulegen HSSS erlaubt die Dokumentenformate PDF PS und DVI sowie die bermittlung per E Mail die Angabe einer URL oder die Abgabe auf einem von der SLUB lesbaren Datentr ger Ein Gro teil der Validierung ist aber auch schon durch den MetadatenGenerator realisiert worden Es m ssen also nur noch technisch nicht automatisierbare Validierungen durchgef hrt werden Sekund re Metadaten beinhalten vor allem bibliothekarische Informationen und Klassifikationen 66 3 1 Gesch ftsmodelle und Arbeitsabl ufe mit dem Referat 5 3 erstellt Der vollst ndige Metadatensatz wir
22. 1 0 encoding UTF 8 gt lt Identify xmins http www openarchives org OAI 1 0 OAI_Identify xmins xsi http www w3 org 2000 10 XMLSchema instance xsi schemaLocation http www openarchives org OAI 1 0 OAI_Identify http www openarchives org OAI 1 0 OAI_Identify xsd gt lt responseDate gt 2001 07 28T117 21 34 01 00 lt responseDate gt lt requestURL gt http hsss slub dresden de hsss servlet hsss oai OAIServlet verb Identify lt requestuRL gt lt repositoryName gt Hochschulschriftenserver HSSS der SLUB Dresden lt repositoryName gt lt baseURL gt http hsss slub dresden de hsss oai servlet hsss oai OAIServlet lt baseuRL gt lt protocolversion gt 1 0 lt protocolversion gt lt adminEmail gt hsss slub dresden de lt adminEmail gt lt description gt lt oai identifier xmins http www openarchives org OAI oai identifier si schemaLocation http www openarchives org OAI oai identifier http www openarchives org OAI oai identifier xsd gt lt scheme gt oai lt scheme gt lt repositoryIdentifier gt hsss lt repositoryIdentifier gt lt delimiter gt lt delimiter gt lt sampleldentifier gt 991830910656 7472 lt sampleldentifier gt lt oai identifier gt lt description gt lt description gt lt eprints xmins http www openarchives org OAI eprints xsi schemaLocation http www openarchives org OAl eprints http www openarchives org OAI eprints xsd gt lt content gt lt URL gt http hsss slub d
23. 14 der die Parameter validiert und der gegenw rtigen Metadatensatz Repr sentation hinzuf gt 15 Danach wird wieder das MetadataGeneratorJSPCommunicator Objekt entsprechend aktualisiert 16 und die Anfrage der jeweils passenden JSP bergeben 17 die ein entsprechendes Formular dynamisch erstellt 18 Nach einer bestimmten Anzahl von Iterationen schlie t der Autor die Eingabe der Metadaten ab 19 Der Controller erh lt ein entsprechendes Signal in Form eines ausgezeichneten Parameters 20 und validiert daraufhin den gesamten Metadatensatz um ihn anschlie end tempor r zu speichern 21 Anschlie Bend invalidiert er die Session 22 und veranlasst dass dem Autor eine Best tigung pr sentiert wird 23 Falls die E Mail Adresse des Autors dem System bekannt ist und er diese Option aktiviert hat erh lt er au erdem eine Best tigungsnachricht per E Mail 24 in der ihm nochmals die Bearbeitungsnummei seines Metadatensatzes 3Unter Controller werden in diesem Zusammenhang das Servlet MetadatageneratorServlet und die oben beschriebenen weiteren Klassen des Packages metadatagenerator verstanden Da sich der gesamte vom Autor zu erstellende Metadatensatz auf mehrere Formulare respektive JSP s verteilt 5 ber die Bearbeitungsnummer kann jederzeit der Bezug zu dem entsprechenden Metadatensatz hergestellt werden da diese ihn eindeutig bestimmt und das solange wie der Metadatensatz im System verbleibt theoretisch ewig Deswei
24. 14In diesem Fall das API finj welches wieder n her im Anhang D beschrieben ist 157 5 Teilanwendung 2 AdminTools mitgeteilt werden was durch das Selektieren des Metadatensatzes und anschlie endes Klicken des Buttons Dokument vorbereitet wird Hier k nnen das entsprechende Verzeichnis und das Dokument ausgew hlt werden Anschlie end kann der Dokumen tenzustand auf den finalen Zustand Dokument OK gesetzt werden Dadurch wird der Gesamtzustand des Metadatensatzes von der Anwendung automatisch auf Vor gang abgeschlossen gesetzt da alle daf r erforderlichen Voraussetzungen erf llt sind siehe dazu auch Abschnitt 5 1 Abbildung 45 zeigt einen Ausschnitt der tempo r ren Metadaten wie ihn der entsprechende Bereich der Anwendung jetzt darstellen w rde Abbildung 45 HSSS AdminTools tempor re Metadaten Zust nde Wie zu erkennen ist entsprechen alle Teilzust nde dem jeweiligen erfolgreichen Endzustand Die Abbildung verdeutlicht ebenfalls noch einmal die schon angespro chene separate Zustandsbeschreibung f r die Exporte hier anhand der Informationen f r den Export nach SWB Der Exportzustand entspricht Metadaten exportiert und der genaue Export Zeitpunkt wurde von der Anwendung festgehalten Zus tzlich wird der Zeitpunkt des Ablaufs der Wartefrist berechnet und angezeigt Der Nutzer hat au Berdem die M glichkeit der Exportnachricht eigene Mitteilungen hinzuzuf gen etwa bei
25. Au erdem sollten die Inhalte die von dieser Anwendung ber das Netz bertragen werden grunds tzlich verschl sselt werden was durch einen SSL f higen Webserver geschehen kann Um den Zugang zu dieser Teilanwendung zu sch tzen wurde zum einen die Nutzerauthentifikation des Webservers genutzt zum anderen muss sich ein Nutzer aber auch bei der Teilanwen dung direkt anmelden Im nicht angemeldeten Zustand ist nahezu keine Interaktion m glich Hat sich der Nutzer hingegen erfolgreich angemeldet werden ihm automa tisch alle tempor ren Metadatens tze innerhalb des Gesamtsystems angezeigt wie die Abbildung 41 auf der folgenden Seite zeigt 5zur Zeit ausschlie lich den entsprechenden Mitarbeitern des Referats 5 3 6Ist ein Nutzer angemeldet kann er diese Seite jederzeit auch durch das Klicken von Metadaten s tze in der oberen Navigationsleiste der AdminTools erreichen 151 5 Teilanwendung 2 AdminTools Interkulturelles Lernen als organisationale Fah Y 994407959125 9687 Registriert 13 07 2001 um 11 22 55 Uhr Ein Beitrag zur Modellierung und Realisierung d Y 994337562500 9924 Registri 12 07 2001 um 09 50 23 Uhr Paarbrechung in Seltenerd Ubergangsmetall Borka 994327565296 0304 05 07 2001 um 12 21 05 Uhr Strategieplanungen f r das hybride Recycling in 2 994324731828 0446 Registri 06 07 2001 um 10 39 53 Uhr Test des Standardmodells im B Mesonen Sektor du BJ 994320110953 0346 06 07 2001 um 11 14 3
26. Microsoft Internet Explorer a Datei Bearbeiten Ansicht Favoriten Extras 2 e e gt B S Ep 2 w Zur ck Vorwarte Abbrechen Aktualisieren Startseite Suchen Favoriten Verlauf E Mail Drucken Bearbeiten Adresse http hsss slub dresden de hsss oai zl Wechseln zu Links Si SL HSSS UB Document Server at SLUB Dresden Germany EN TECHNISCHE LI UNIVERSITAT DRESDEN Content The Online Document Server HSSS contains full texts of dissertations and habilitations from 1999 onward as well as documents of research and science at the University of Technology Dresden The Online Document Server is a server of the SLUB Dresden and it serves as reference and long term archive for scientific electronic documents of research and science at the University of Technology Dresden TU Dresden Members of the TU Dresden have the opportunity to offer their scientific publications and electronic text documents on the internet to subject index them and to make them freely accessible provided that no copyright or licensing laws are violated and that the faculty agreed The electronic documents are bibliographically described using structured DC Metadata electronically saved presented uniformly and are therewith retrievable from every work place Documents of all faculties of the TU Dresden mathematics and natural sciences incl psychology philosophy languages and literary sciences education
27. einfach erm glicht und zudem im Laufe der Diplomarbeit eine Datenbank f r das Ge samtsystem zur Verf gung steht besteht die M glichkeit die dritte Teilanwendung als Portal L sung zu konzipierer womit dabei insbesondere der Personalisierungs aspekt gemeint ist Dazu ist die M glichkeit zu schaffen dass sich beliebige Nutzer bei dem System dauerhaft registrieren k nnen F r diese Nutzer k nnen dann Infor mationen gespeichert werden die ihnen eine personalisierte Sicht auf die Anwendung erlauben Dadurch l sst sich das Angebot besonders nutzerfreundlich und vor allem individuell gestalten was die Akzeptanz aber auch die Effektivit t der Anwendung deutlich erh hen kann Die vierte Architekturvision lautet daher Architekturvision 4 Die dritte Teilanwendung soll als Portal L sung realisiert werden Dazu geh rt die Integration externer Inhalte die um HTML Elemente clientseitig zur Laufzeit dynamisch zu ndern Die Ans tze sind dabei leider f r die jeweiligen Browser verschieden Quellen http msdn microsoft com library default asp url workshop author dhtml dhtml asp Microsoft http developer netscape com tech dynhtm1 Netscape 25 Was ber JavaScript mit Einschr nkungen realisierbar w re 26Dazu z hlt die Realisierung von mindestens zwei Detailstufen bei der Ergebnisdarstellung sowie die Unterst tzung von Teilergebnissen Bl ttern im Gesamtergebnis 27So k nnten andere in Beziehung stehende Inhal
28. gesammelt werden Auch innerhalb dieser Teilanwendung konnten mit Hilfe der beiden Auszubilden den der SLUB zus tzliche Funktionalit ten insbesondere im Administrationsbereich realisiert werden So erm glicht insbesondere der Zugriff auf die Konfigurationsstruk turen und die XSL Stylesheets ber die Web basierte Anwendung flexible nderungen am Gesamtsystem von berall aus und in der Regel zur Laufzeit Damit steht den 174 5 4 Einsch tzung Mitarbeitern des Referates 5 3 ein m chtiges Werkzeug zur Verf gung Neben diesen positiven Eigenschaften sollen im Folgenden aber auch Bereiche der Teilanwendung betrachtet werden die Verbesserungsm glichkeiten offen lassen bzw bei denen Erwei terungen sinnvoll sind e Die bersichtseiten auf denen alle aktuellen bzw alle eingestellten Metadaten s tze pr sentiert werden sollten die M glichkeit bieten nur bestimmte Meta datens tze anzuzeigen Damit w rde dem Umstand Rechnung getragen dass gerade die Zahl der bereits eingestellten Metadatens tze immer st rker anw chst und somit bald eine Menge erreicht wird die nicht mehr bersichtlich pr sen tiert werden kann Dieses Problem k nnte durch die Auswahl von Teilmengen z Bsp die 20 neuesten Metadatens tze bzw durch Iteration zeige immer nur 10 Metadatens tze entsch rft werden e Die XML basierten Strukturen sind zwar innerhalb der Teilanwendung sichtbar und k nnen dort auch ge ndert und zur ckgespeic
29. gewonnen Die Feldinhalte werden zum Teil in Abh ngigkeit des gew hlten Detaillie rungsgrades gesetzt und teilweise noch entsprechend behandelt Anschlie end wird 2580 liefert getDescription nur die ersten 1000 Zeichen einer Beschreibung zus tzlich werden die Separator Zeichen xxx entfernt und ad quat ersetzt z Bsp Zeilenumbruch etc 195 6 Teilanwendung 3 HSSS AccessTools myHSSS der entstandene Hit sowohl der zur ckzuliefernden Ergebnismenge result als auch der Cache Datenstruktur results hinzugef gt Zeile ss und 39 Ist dieser Vorgang f r alle Dokumente der aktuellen Teilmenge abgeschlossen wird die Ergebnismenge result zur ckgegeben und kann von der View entsprechend pr sentiert werden Sollte diese Teilmenge noch einmal angefordert werden kann sie direkt aus dem Cache results geholt werden und damit noch schneller zur ckgeliefert werden Dadurch erreicht der hier vorgestellte Ansatz eine sehr gute Skalierung in Abh ngigkeit der vom Autor wirklich geforderten Teilergebnisse und eine sehr gute Performance 196 6 3 Realisierung 6 3 Realisierung Nachdem im vorangegangenen Abschnitt mit der Vorstellung der Volltextsuchmaschine Lucene und mit deren Integration in die Gesamtanwendung serverseitige Aspekte der dritten Teilanwendung behandelt wurden soll sich dieser Abschnitt speziell mit der Clientseite besch ftigen Dabei stehen die Realisierung der Benutzerschnittstelle un
30. r Neulinge in diesem Gebiet an Transparenz So gibt es eine Vielzahl sich thematisch berschneidender Initiativen mit teilweise alternativen und konkurrierenden Ans tzen Fine Vielzahl der verwendeten Technologien ist zudem veraltet und schlecht dokumentiert Erster Kritikpunkt ist daher die u erst schlechte Koordination Nach Meinung des Autors fehlt es einfach an einer bergeordnet verantwortlichen Organisation die f r die nationale Koordi nierung aller Aktivit ten legitimiert ist Nur dadurch w rden sich berschneidende Forschungsprojekte und inkompatible Archive verhindern bzw gemeinsame Zielset zungen und Protokolle wirksam und vor allem wesentlich schneller umsetzen lassen Der n chste Kritikpunkt betrifft die vorhandenen Hilfestellungen In vielen F llen sind sie nicht praxisorientiert genug um als erfolgreiche Anleitung f r eine poten tielle Neuentwicklung eines Archives genutzt werden zu k nnen Hier w re weniger oft mehr F r eine Institution die sich entscheidet ein digitales Archiv aufzubauen sind in erster Linie nicht alle nur m glichen technischen Gesichtspunkte interessant sondern kurze exakte Aussagen zu den wichtigsten Punkten die unbedingt beachtet werden sollten Auch das ansonsten sehr gut gestaltete Informationsangebot von Dis sertationen Online w rde durch eine gestraffte Zusammenfassung aller existentiellen Anforderungen an bersichtlichkeit gewinnen Ein besonders positiver Umstand ist die OAI u
31. r die An wendung realisiert ConfigurationManager DBManager Transaction dbManager SQLManager null con Connection null man DBManager null dbProps Properties new Propertie man DBManager null ConfigurationManager usePool boolean false getHsssDataXml tableinfo String S oneConnection boolean false Transaction man DBManager getAccessListXmi tableinfo String l prepareStatement query String getMetadataSet tableinfo String doq DBManager prepareCallableStatement query getProcessingStatelnformation id S DBManager infofile String usepool executeStatement stmt Prepared setConfigFile tableinfo String conte DBManager config ServletConfig u executeCallableStatement stmt q setConfigFile tableinfo String conte DBManager config ServletConfig commit boolean getinstance DBManager rollback boolean transactionValid boolean TemporalMetadataManager man DBManager null TemporalMetadataManager store TemporalMetadata tableinfo S loadTemporalMetadataSets tableinf updateTemporalMetadata tableinfo backupTemporalMetadata tableinfo statTemporalMetadata documenttypl deleteTemporalMetadata tableinfo resetTemporalMetadata tableinfo S loadTemporalMetadata tableinfo Sti finishTemporalMetadata kindofdoc SybaseTemporalMetadataManager Abbildung 30 HSSS Package db Die Abbildung zeigt als wichtigste Instanz die Klasse DBManager die als Sin
32. sen Dabei enth lt das Package metadataset hsss alle Klassen welche die Umsetzung der Metada O ee tensatzstruktur in die entsprechende Struktur von 3 utilities i CH CT ee Sg Java Objekten realisieren also die eigentlichen Ge EZ utilities sch ftsobjekte sowie Klassen die sich inhaltlich metadatagenerator auf den Metadatensatz beziehen Validatorklassen 3 utilities etc Auch dieses Package besitzt eine Reihe metadataset von Werkzeugklassen in einem separaten Package C utilities utilities Die Packages persistence und oai temporalpersistence enthalten Klassen die sich ar u schwerpunktm ig im weitesten Sinne mit Persistenz E See dazu geh rt auch das Einlesen und Schreiben von 3 23 utilities Konfigurationsdateien bzw tempor rer Persistenz 3 db das XML basierte Zwischenspeichern der Metada E ftp tens tze w hrend ihrer Bearbeitung besch ftigen a lucene Mit urlmapping ist ein Package bezeichnet des J mail sen Klassen die Abbildung der absoluten virtuellen a URL s auf die zugeh rigen realen URL s vornehmen Di Das Package utilities schlie lich enth lt Klas Abbildung sen die in der gesamten Anwendung Verwendung fin 91 HSSS den zum Teil auch einfache Gesch ftsobjekte sowie Verzeichnis eine Reihe von Hilfs und Werkzeugklassen Au er hierarchie dem integriert bzw kapselt diese
33. teratur zu entnehmen und vergleichend zu bewerten Die eingesetzten Werkzeuge mit denen ja oft noch nicht sehr viel Erfahrung gemacht wurde sind ebenfalls zu pr fen und zu bewerten Arbeitsschritte e Auswahl eines Datenbankverwaltungssystems e Schemaentwurf e Anpassung der Programme aus dem Beleg an die Nutzung der Datenbank vor allem durch Anleitung der in der Abt DV der SLUB f r Programmierarbeiten einsetzbaren Auszubildenden e Entwurf einer Verzeichnisstruktur f r die Dokumente e Generierung der Frontdoors aus der Datenbank e Entwurf und Realisierung von hierarchischen Strukturen f r die Navigation e Entwurf und Realisierung einer Suchmaske sowie der Darstellung von Ergebnis listen e Dokumentation 29 2 Aufgabenstellung Grundlagen Arbeitsabl ufe 2 2 Interpretation der Aufgabenstellung Bei dieser Diplomarbeit handelt es sich um die inhaltliche Fortsetzung und Erweite rung einer Belegarbeit Schb00 deshalb wird an vielen Stellen auch auf Erkenntnisse und Ergebnisse dieser Arbeit zur ckgegriffen werden mit dem R ckblick auf die Be legarbeit besch ftigt sich vor allem Abschnitt 2 3 auf Seite 33 Wie in Abschnitt bereits kurz dargelegt soll diese Fortsetzung dazu fiihren dass alle fiir die erste Aus baustufe des HSSS vereinbarten Dienste m glichst vollst ndig aber eben prototypisch realisiert werden Dies erst erlaubt das Testen und Verbessern der mit dem HSSS verbundenen Arbeitsabl ufe Wie au
34. tzen Versucht man den in Abschnitt spezifizierten Gesch ftsablauf anhand der Teilanwendung AdminTools zu demonstrieren erfolgte also nach einer erfolgreichen Anmeldung und der Sichtung aller aktuellen Metadatens tze die Selektion eines ange nommenen neuen Metadatensatzes der erst kurze Zeit zuvor von einem Autor erstellt wurde Danach w rde der Nutzer ein Mitarbeiter des Referates 5 3 auf Bearbeiten klicken um sich die vorhandenen Metadaten Prim r Metadaten des Metadatensat zes anzeigen zu lassen Diese werden von der Anwendung wie in Abbildung 42 auf der folgenden Seite pr sentiert Die einzelnen Dublin Core Kategorien des Metadaten satzes inklusive der tempor ren Metadaten in der Abbildung nicht zu sehen werden separat und bersichtlich angezeigt Dabei werden die drei verschiedenen Arten von Metadater auch jeweils farblich unterschiedlich hervorgehoben ebenso existiert eine farbliche Unterscheidung f r obligatorische bzw optionale Metadaten die Metadaten eines Metadatensatzes unterteilen sich in Prim r Metadaten Metadaten des Autors Sekund r Metadaten Metadaten der Bibliothek Klassifikationen etc System Metadaten vom System vorgegebene in der Regel nicht nderbare Metadaten 153 5 Teilanwendung 2 AdminTools rr Dr Prof Prof Raif Witt Abbildung 42 HSSS AdminTools Die Metadaten eines Metadatensatzes ber die Navigationsleiste die sich
35. verschiedene Arten benutzt werden Er wird ebenfalls von der ASF entwickelt Einsatzbereich innerhalb des Gesamtsystems Xalan wird verwendet um die XML basierten Metadatens tze in andere Formate zu transformieren z Bsp in Text f r E Mails oder XHTML Exportformate DDB SWB und Frontdoor D 2 7 FOP Produktname FOP Version 0 19 Homepage http xml apache org fop index html Beschreibung FOP ist der erste Druckformatierer der auf XSL Formating Objects FO ba siert FOP kann aus einem XML basierten Formating Object Tree PDF zur Laufzeit erzeugen und wird ebenfalls von der ASF entwickelt Einsatzbereich innerhalb des Gesamtsystems FOP wird in Verbindung mit Xalan dazu verwendet zur Laufzeit aus einem XML basierten Metadatensatz ein PDF Dokument zu generieren das Teile dieses Metadatensatzes beschreibt D 2 8 JDOM e Produktname JDOM 280 D 2 Open Source Technologien Produkte e Version 1b7 e Homepage http www jdom org e Beschreibung JDOM ist ein API f r den javabasierten Zugriff Manipulation und Erzeugung auf von XML Strukturen Dabei nutzt JDOM intern Parser wie etwa Xerces fungiert aber als Abstraktionsschicht und bietet Java Entwicklern gewohnte Auf rufsemantiken und Datenstrukturen e Einsatzbereich innerhalb des Gesamtsystems JDOM wird in Verbindung mit Xerces an allen Stellen genutzt an denen XML Strukturen geparst bzw erzeugt werden m ssen D 2 9 PoolM
36. wobei der Zu stand eines jeden Metadatensatzes im Normalfall nat rlich Vorgang abgeschlossen entsprechen sollte F r die einzelnen Metadatens tze sind dieselben Aktionen m glich so dass auch im Nachhinein noch Metadaten Bearbeiten und Dokumentinforma tionen Dokument ver ndert werden k nnen Auch das Drucken von Prim rmeta daten Drucken ist m glich und die Metadatenexporte k nnen gegebenenfalls noch einmal ausgef hrt werden Export DDB bzw Export SWB Das R cksetzen des Metadatensatzes R cksetzen f hrt auf die zuletzt eingestellte Version zur ck Das L schen des Metadatensatzes durch L schen w rde den Metadatensatz zwar aus der Tabelle temp_metadatesets_finished nicht jedoch aus der persistenten Datenbasis des System entfernen Einstellen w rde einen bereits eingestellten Metadaten satz noch einmal einstellen also aktualisieren wobei alle oben beschriebenen Schritte ausgef hrt werden So k nnen auch im Nachhinein noch nderungen an den Metada tens tzen in der persistenten Datenbasis des Gesamtsystems durch die Teilanwendung AdminTools vorgenommen werden 5 2 2 Administrationsunterst tzung Neben den im vorigen Abschnitt vorgestellten Funktionalit ten die die Gesch fts modelle der Dokumentenarten technisch begleiten bieten die Admin Tools eine Reihe zus tzlicher Funktionalit ten welche die Administration des Gesamtsystems unter st tzen Um diese
37. 0 Treffe ee vorhanden sind Esel Suchen R cksetzen M detailierter Report HINWEIS In allen oben genannten Seier fo SE Feldern kann der Platzhalter xxx HSSS Ergebnisgr e eingetragen werden um alle SLUB verf gbaren Datens tze anzuzeigen gt Verkn pfungen muss kann nicht TU Dresden Dama 01 01 1999 von ja bis Erm glicht durch logische Operatoren eine Eingrenzung der Suchergebnisse muss der Begriff muss im Suchfeld enthalten sein 3 Treffer gefunden zeige Treffer 1 bis 3 kann der Begriff kann im Suchfeld z enthalten sein F zur ck 1 weiter s nicht der Begriff darf nicht im Seite 1 Suchfeld enthalten sein gt Report 1 Dissertation Translationsaktivatoren der mitochondrialen Cytochrom b Synthese in Saccaromyces Erm glicht Anzeige detailierter cerevisiae Membranassoziation Mutagenese und Protein Wechselwirkungen von Chal Ken ID IE 20 2 u E A g l gt Ergebnisgr e s Autor Udo Krause Buchholz Grenzt die Anzahl der zu zeigenden Datum 10 10 2000 Datens tze je Seite ein gt Datum 4 E Fertig g Internet Abbildung 57 myHSSS Feldsuche in der Aufl sung 1024 768 Dabei ist zu anzumerken dass sich die Skalierung sowohl auf die Ma e der einzelnen HTML Strukturen bezieht Tabellenbreiten h hen etc als auch auf Schriftgr erf und Grafiken Allerdings bestand in der Skalierung der Grafiken das gr te Pro blem d
38. 000 eee eee 5 2 Realisierung o a 5 2 1 Unterst tzung der Arbeitsabl ufel e 5 2 2 Administrationsunterst tzung 5 3 Persistenzrealisierungl 5 4 Einschatzungl ceci a a a 145 5 Teilanwendung 2 AdminTools 5 1 Analyse und Design Viele Aussagen zur objektorientierten Analyse und zum Design dieser Teilanwendung wurden von vorangegangenen Kapiteln bzw Abschnitten bereits getroffen siehe dazu insbesondere die Abschnitte und und sollen deshalb an dieser Stelle nicht noch einmal wiederholt werden Stattdessen soll der Abschnitt Besonderheiten des Entwurfs der Teilanwendung AdminTools n her beleuchten Diese Besonderheiten ergeben sich zumeist aus der prim ren Aufgabe dieser Teilanwendung die darin be steht die in Abschnitt B 1 spezifizierten Arbeitsabl ufe technisch so gut wie m glich zu begleiten Dazu muss die Anwendung bestimmte interne und externe Zust nde kennen und entsprechend behandeln k nnen Diese Zust nde werden in der Konfigurations struktur hsssdata xml definiert und stehen der Anwendung damit zur Verf gung Zu den internen Zust nden geh ren solche die sich auf die Metadaten der Hochschul schrift und solche die sich auf die Dokumente selbst beziehen Tabelle 6 zeigt die f r Dokumente typischen Zust nde Zustand ZUSTANDSBESCHREIBUNG Dokument nicht vorhanden Ausgangszustand Das Dokument ist noch nicht vorhan den
39. 1 2 Referat 3 4 Referat 5 3 e O E fu w pu c 1 3 Pflichtexemplare Vermerk ip 2 2 Pflichtexemplare mif Vermerk el Version verf gbar 3 1 Pflichtexemplar 4 2 ER Pflichtexempl TP 5 2 klassifizierte Pflicht xemplare Abbildung 8 Sequenzdiagramm Gesch ftsgang in Bezug auf das Referat 3 4 2 Pflichtexemplare Das Referat 3 4 erh lt zun chst vom Referat 5 3 drei Pflichtexemplare Druckexem plare der Dissertation mit dem Vermerk Zu diesem Dokument ist eine elektronische Version in K rze verf gbar 1 Diese Exemplare werden vom Referat 3 4 an externe Institutionen verschickt Zwei davon gehen an die DDB Die Deutsche Bibliothek zu sammen mit dem genannten Vermerk 2 Der Vermerk geht deshalb an die DDB weil diese Institution ja ebenfalls die Metadaten der elektronischen Version der Dissertation erh lt allerdings in der Regel erst sp ter siehe Sequenzdiagramm Referat 5 3 Da die DDB zu dem Zeitpunkt wenn sie die Druckexemplare erh lt nicht wissen kann ob diese Dissertation auch elektronisch publiziert wird ist dieser Vermerk sinnvoll ins besondere deshalb weil er der DDB die Chance gibt die lokale Katalogisierung nicht anhand der sp rlichen zur Druckversion verf gbaren Informationen zu unternehmen sondern anhand der wesentlich umfangreicheren Metadaten der elektronischen Versi on Ein Pflichtexemplar wi
40. 100 vi Name der Sprache acronym char 10 Y Abk rzung der Sprache nach bestimm ten Schema scheme varchar 50 verwendetes Schema ISO66 annotation varchar 255 optionale Bemerkung unique acronym Tabelle A70 die Tabelle pers_ language pers_person Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV v y eindeutige Identifikationsnummer f r die Tabelle firstname varchar 100 y Vorname lastname varchar 100 vi Nachname title varchar 100 Titel Anrede etc unique firstname lastname title Tabelle A71 die Tabelle pers_person pers_publication Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV v vy eindeutige Identifikationsnummer f r die Tabelle name varchar 255 y Titel einer Publikation isbn varchar 100 ISBN der Publikation annotation varchar 255 optionale Bemerkung unique name Tabelle A72 die Tabelle pers_publication 268 C 2 Schema pers_relation Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV vV vy eindeutige Identifikationsnummer f r die Tabelle relation varchar 255 y Literaturquelle Name URL etc annotation varchar 255 optionale Bemerkung unique relation Tabelle A73 die Tabelle pers_ relation pers_rights Name DATENTYP I P M BESCHREIBUNG id numeric 4 vV VJ y eindeutige Identifikationsnummer f r die Tabelle name varchar 255 y Name der Ressource f r
41. 50 Tabelle A37 HSSS Metadatensatz Sprache des Dokuments A 2 13 DC RELATION Bezeichnung LITERATURQUELLEN EXTERN Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Verweise auf Literaturquellen allgem Dokumente die mit der Hochschulschrift in Beziehung stehen DC Relation Extern de relation extern primary optional 0 n 10 255 Tabelle A38 HSSS Metadatensatz Literaturquellen extern Bezeichnung LITERATURQUELLEN INTERN Beschreibung URL einer internen Literaturquelle i d R Dokument auf HSSS DC Bezeichnung DC Relation Intern Parametername dc_relation_intern Metadatentyp secondary Regulation optional H ufigkeit 0 n L ngenrestriktion 10 255 Tabelle A39 HSSS Metadatensatz Literaturquellen intern 242 A 2 Spezifikation der Metadaten A 2 14 DC RIGHTS Bezeichnung RECHTLICHE BEDINGUNGEN Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Name Version und URL der Datei die die rechtlichen Bedingun gen enth lt DC Rights de_rights system mandatory 1 1 10 255 Tabelle A40 HSSS Metadatensatz rechtliche Bedingungen 243 A Metadatens tze des HSSS A 3 Spezifikation der tempor ren Metadaten Bezeichnung ART DER DOKUMENT BERMITTLUNG Beschreibung DC Bezeichnung Parametername Metadate
42. 68 3 1 Gesch ftsmodelle und Arbeitsabl ufe Wenn sowohl die prim ren als auch die sekund ren Metadaten korrekt validiert sind ist der Metadatensatz im bibliothekarischen Sinne vollst ndig so dass er jetzt an die entsprechenden externen Institutionen exportiert werden kann Der Metada tenexport erfolgt technisch automatisiert an die Institutionen SWB S dwestdeutscher Bibliotheksverbund und DDB Die Deutsche Bibliothek mit Hilfe der Administrati onsanwendung 11 wird aber von einem Mitarbeiter des Referats 5 3 manuell in itiiert Die DDB sendet im Falle eines erfolgreichen Empfangs eine Erfolgsmeldung via E Mail 12 Der SWB verschickt keine explizite Erfolgsmeldung sondern erstellt auf der Basis der exportierten Metadaten eine Titelaufnahme f r die Dissertation im MAB Format Maschinelles Austauschformat f r Bibliotheken 13 Ein solcher Eintrag kann vom Referat 4 1 bzw 4 2 in der SWB Katalogisierungsdatenbank er kannt werden weil er eine entsprechende Markierung besitzt 14 Wird eine solche Markierung gefunden meldet das Referat 4 1 4 2 das Vorhandensein dieses MAB Datensatzes an das Referat 5 3 15 Dort wird der MAB Datensatz berpr ft und mit den Ausgangs Metadaten verglichen die sogenannte Hochkatalogisierung 16 Konnte diese berpr fung erfolgreich abgeschlossen werden so wird der Metadaten satz mit Hilfe der Administrationsanwendung endg ltig in die persistente Datenbasis des Systems eingestell
43. Aktionen wurde bereits in der Belegarbeit Schb00 vorgenommen und liegt au erhalb des hier betrachteten Abstrak tionsgrades Am Ende dieser Nutzung erh lt das Referat 5 3 eine Information ber den Eingang eines neuen Metadatensatzes 2 und der Autor gegebenenfalls eine Be st tigungsnachricht 3 jeweils in Form einer E Mail Anschlie end gibt der Autor die geforderte Anzahl von Druckexemplaren und die elektronische Version seines Do kumentg im Referat 5 3 ab 4 Jetzt werden sowohl die Metadaten als auch die 3Dazu sind vom System sowohl die akzeptierten Formate als auch die m gliche bermittlungsmodi 65 3 Systemarchitektur Dokumente des Autors von Mitarbeitern des Referats 5 3 validiert 5 Im Falle einer erfolgreichen Validierung erh lt der Autor eine Best tigung andernfalls eine Fehler meldung die ihn anweist die notwendigen Ressourcen Metadaten Druckexemplare digitales Dokument korrekt zur Verf gung zu stellen 6 Vom Referat 5 3 werden eine Reihe von Aktionen in Verbindung mit dem Referat 3 4 ausgef hrt die in einem noch folgenden das Referat 5 3 betreffenden Sequenzdiagramm detaillierter dargestellt werden 7 Als letztes erh lt der Autor vom Referat 3 4 eine Best tigung die er der Pr fungskommission vorlegen muss um seine Promotionsurkunde zu erhalten 8 SLUB Gesch ftsmodell f r Dissertationen Metadaten des Autoren validieren Prim r Metadaten Referat 5 3 Autor Dokument validieren
44. Auf der rechten Seite jedes Trefferbereichs werden die Informationen zu der ent sprechenden Hochschulschrift in Abh ngigkeit des gew hlten Detaillierungsgrades pr sentiert Dies sind vor allem der Dokumententyp und der Originaltitel der Hoch schulschrift Dieser ist als Link realisiert der beim Aktivieren die passende Frontdoor in einem neuen Fenster ffnet Au erdem werden die Autoren und das Ver ffent lichungsdatum der Hochschulschrift genannt Ist die Option detaillierter Report vom Benutzer aktiviert worden werden zus tzlich alle weiteren Titel alternative oder bersetzte Titel und die vorhandenen Beschreibungen Abstracts f r die Hochschul schrift angezeigt Zum Abschluss sollen noch einmal die bisher innerhalb von myHSSS verf gbaren Funktionen zusammengefasst und kurz erl utert werden e News Hier lassen sich alle innerhalb eines bestimmten Zeitraums ver ffentlichten Hoch schulschriften anzeigen Die vorgegebenen Rubriken sind 1 Woche 2 Wo chen 1 Monat 3 Monate und 6 Monate jeweils zur ckgerechnet vom aktuellen Datum e Volltextsuche Die Volltextsuche erm glicht eine Suche innerhalb des Volltextes und oder re lativ grob in allen Feldern des Index einer Hochschulschrift ohne dass diese 28die vom Nutzer durch eine entsprechende Eingabe bei Ergebnisgr e festgesetzt werden kann Diese Wertigkeit wird von Lucene berechnet scoring und h ngt u a von der Varianz de
45. Bsp ein Unique Identifier und Datestamp e Dem Metadata Abschnitt Die Metadateninformationen f r das Element in ei nem bestimmten Metadatenformat Das OAI Protokoll erlaubt die Beschreibung mit verschiedenen Metadatenformaten ein Repository muss aber zumindest in der Lage sein ein Record mit im Dublin Core Metadatenformat L DC beschrie benen Metadaten zur ckzuliefern e Dem About Abschnitt Ein optionaler Abschnitt der Informationen ber den vorangegangenen Metadata Abschnitt enth lt typischerweise rechtliche Bedin gungen oder Nutzungshinweise 40 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld 1 lt header gt 2 lt identifier gt oai hsss 99010018976 5678 lt identifier gt 3 lt datestamp gt 2001 01 01 lt datestamp gt 4 lt header gt 5 lt metadata gt 6 lt dc xmlns http purl org dc elements 1 1 7 xmlns xsi http www w3 org 2000 10 XMLSchema instance 8 xsi schemaLocation http purl org dc elements 1 1 9 http www openarchives org OAI dc xsd gt 0 lt title gt Quo Vadis Quanten lt title gt 11 lt creator gt Quark T lt creator gt 12 lt creator gt Sprung Q lt creator gt 3 lt description gt We simulate the center of mass motion of cold atoms in a 4 standing amplitude modulated laser field as an example of a system 15 that has a classical mixed phase space lt description gt 16 lt date gt 2001 01 01 lt date gt
46. Client seitig mit Hilfe von JavaScript validiert 34 2 3 R ckblick auf den Gro en Beleg und vor allem bei dem Design neuer Teilanwendungen sollen die vorhandenen objekt orientierten Strukturen noch verbessert werden insbesondere ist die Verwendung und Integration von Entwurfsmustern zu berdenken Weitere Verbesserungsm glichkeiten ergeben sich unter Umst nden aus der Betrachtung bereits existierender Hochschul schriftenserver bzw durch die Auswertung der Arbeit von Organisationen und In itiativen im Umfeld digitaler Publikationen Archive insbesondere im Hinblick auf existierende Standards und zu beachtende Empfehlungen Mit dieser Thematik wird sich der folgende Abschnitt auseinandersetzen 39 2 Aufgabenstellung Grundlagen Arbeitsabl ufe 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld Wie in Kapitel 1 im Abschnitt zur Motivation bereits dargelegt wurde m ssen sich vor allem die Universit tsbibliotheken in Zukunft neuen Herausforderungen stellen Durch den Siegeszug von Computer und Internet hat sich die Art und Weise des Publizierens insbesondere an wissenschaftlichen Einrichtungen stark ver ndert und wird sich weiter stark ver ndern Um sich diesen Herausforderungen stellen zu k nnen m ssen sich die Bibliotheken verst rkt mit den neuen technischen M glichkeiten auseinandersetzen und in diesen Bereichen Know How aufbauen Wis01 Der Aufbau eines Dokumentens
47. Das Tag SubElementValidation enth lt mit den Tags Length und Frequency ent sprechende Validierungsangaben 214 der 15 Dublin Core Kategorien sowie die tempor ren Metadaten die als separates Element realisiert sind 3zur Zeit existiert also lediglich eine Hierarchietiefe von 2 259 B Konfigurationsstrukturen des HSSS 1 lt xml version 1 0 encoding ISO 8859 1 gt 2 lt MetadataSet documenttype Dissertation gt 3 lt Element gt 4 lt ElementDCName gt 5 DC Title 6 lt ElementDCName gt 7 lt ElementDescription gt 8 Titel 9 lt ElementDescription gt 0 lt ElementLabel gt 1 lt CDATA 2 Bitte geben Sie den Titel des Dokuments ein 3 gt 4 lt ElementLabel gt 5 lt SubElements gt 6 lt SubElement gt 7 lt SubElementDCName regulation mandatory metadatatype primary gt 8 DC Title 9 lt SubElementDCName gt 20 lt SubElementDescription gt 21 Originaltitel 22 lt SubElementDescription gt 23 lt SubElementLabel gt 24 Originaltitel 25 lt SubElementLabel gt 26 lt SubElementParameterName gt 27 de title 28 lt SubElementParameterName gt 29 lt SubElement Validation gt 30 lt Length min 15 max 2000 gt 31 lt Length gt 32 lt Frequency min 1 max 1 gt 33 lt Frequency gt 34 lt SubElementValidation gt 35 lt Parameter name dc_title_language type DC Language gt lt Parameter gt 36 lt SubElement gt 37 lt SubElement gt 38 ose 39 lt SubElemen
48. Datei beeinflu bar ist Zus tzlich kann der UrlMapper ber eine de finierte Schnittstelle von au en angesprochen und dazu gebracht werden eine Ak tualisierung sofort durchzuf hren Dies macht insbesondere dann Sinn wenn eine Anwendung wei dass sich die Abbildungsmenge gerade ge ndert hat Das Servlet MappingServlet hat somit immer auf eine Datenstruktur mit nahezu aktuellen Ab bildungen Zugriff und kann die Abbildung durch das Suchen eines eindeutigen Schl s sels absolute URL innerhalb der Datenstruktur Hashtabelle im Hauptspeicher sehr effizient durchf hren F r die bisherige allerdings auch nicht sehr gro e Zahl von persistenten Metadatens tzen funktionierte diese Art der Abbildung sehr stabil und performant Als Ergebnis wird vom MappingServlet der Inhalt der realen URL also die jeweilige Frontdoor pr sentiert jedoch immer noch unter der absoluten URL wie Abbildung 53 auf der n chsten Seite demonstriert also delete und insert anstelle von update 8Diese M glichkeit wird unter anderem von der Teilanwendung Admin Tools genutzt wenn ein Me tadatensatz gerade erfolgreich eingestellt wurde 183 6 Teilanwendung 3 HSSS AccessTools myHSSS 3 HSSS FrontDoor Version 1 4 Microsoft Internet Explorer olx Datei Bearbeiten Ansicht Favoriten Extras 2 FE rn ancien A 2 4 IS a Zach amarte Abbrechen Aktualisieren Startseite Suchen Favoriten Verlauf E Mail Drucken Bearbeiten Adresse h
49. E Mail Diensten bekanntes Formular erstellen lassen dass im Nachrichtenfeld bereits die prim ren Metadaten enth lt Es muss nur noch die Adresse des jeweiligen Fachreferenten angegeben werden und durch ein weiteres Klicken auf Absenden w rde die Nachricht von der Anwendung auto matisch an den Fachreferenten gesendet Im weiteren Verlauf des Gesch ftsganges w rde der Fachreferent auf der Grundlage des Druckexemplars der elektronischen Version und den erhaltenen prim ren Metadaten die Sekund r Metadaten erstellen Diese sendet er entweder per E Mail oder durch die Hauspost wieder an das Referat 5 3 zur ck Hier w rde man den Gesch ftsgang mit Hilfe der AdminTools fortset zen indem in dem Bearbeitungsbereich siehe Abbildung 42 die entsprechenden 10 dies geschieht mit Hilfe von XML Technologien insbesondere durch Xalan und FOP siehe Anhang Zu diesem Zwecke wird das JavaMail API verwendet so dass die Anwendung nicht auf externe lokale E Mail Clients angewiesen ist N heres siehe Abschnitt D im Anhang 155 5 Teilanwendung 2 AdminTools Sekund r Metadaten des Fachreferenten f r den Metadatensatz eingegeben werden Diese Metadaten werden anschlie end validiert indem der Metadaten Zustand zuerst auf Validierung Sekund rmetadaten gesetzt und anschlie end wieder auf nde rungen speichern geklickt wird Sind alle insbesondere die sekund ren Metadaten vollst ndig und korrekt befindet sich d
50. F r den Fall einer erstmaligen Einstellung des Metadatensatzes wird an den Au tor eine E Mail versendet die ihn darauf hinweist dass seine Hochschulschrift erfolgreich persistent archiviert wurde und die ihm die absolute URL zur Front door seiner Hochschulschrift mitteilt die er im Folgenden als Referenz benutzen kann Gleichzeitig ist er aufgefordert die von der Anwendung erstellte Pr sentation der Metadaten die Frontdoor und die elektronische Version seines Dokuments im Pr sentationsformat noch einmal auf inhaltliche Korrektheit und Vollst ndigkeit zu berpr fen e Der Metadatensatz wird als Objekt aus der Objektstruktur aller tempor ren Metadatens tze im Hauptspeicher der Anwendung gel scht so dass er auch in dem Ubersichtsformular in dieser Rubrik nicht mehr erscheint Wie im letzten Punkt angedeutet erscheint der Metadatensatz in der in Abbil dung 41 gezeigten Metadatensatz bersicht nicht mehr Stattdessen ist dieser Metada tensatz in der Kategorie der eingestellten Metadatens tze sichtbar die man durch das 7Wobei die Erstellung der Frontdoor nicht automatisch zur ckgesetzt werden kann da es keine Datenbankoperation ist sondern explizit durch die Anwendung zur ckgesetzt gel scht werden muss 161 5 Teilanwendung 2 AdminTools ndern des Radiobuttons von aktuelle auf eingestellte und anschlie endes Klicken auf Aktualisieren erreicht Dort findet sich eine hnliche Auflistung
51. Funktionalit ten Dieses Formular ist vom Autor nach und nach abzuarbeiten wobei trotz der ge ringen Anforderungen an den Browser eine gewisse Benutzerfreundlichkeit realisiert werden konnte indem immer wieder an die korrekten Stellen innerhalb des Formu lars gesprungen wird Au erdem ist auch f r diese Version eine kontextsensitive Hilfe verf gbar welche ebenfalls separat navigierbar ist Nachdem der Autor das Formular vollst ndig ausgef llt hat kann er es durch ein Klicken auf Weiter komplett validie ren lassen Hat er den rechtlichen Bedingungen zugestimmt wird der Metadatensatz tempor r gespeichert und der Autor erh lt auch hier eine Best tigungsnachricht Auch f r die alternative Version existiert ein Fragebogen der vom Autor ausgef llt werden kann falls er das w nscht 141 4 Teilanwendung 1 MetadatenGenerator 4 5 Einsch tzung Die Teilanwendung MetadatenGenerator ist aufgrund der Tatsache dass sie schon in der Belegarbeit umfassend implementiert wurde und im Rahmen der Diplomar beit noch einmal nahezu vollst ndig neu realisiert wurde von allen Teilanwendungen des Gesamtsystems die am besten getestete Sie wird auch am ehesten allen Anfor derungen an eine Produktiv Versiorf gerecht und bietet eine Reihe sehr n tzlicher zus tzlicher Funktionalit ten Dabei geht die Teilanwendung in vielen Bereichen ber die Anforderungen an eine solche Schnittstelle weit hinaus Dazu z hlt insbesonde re d
52. HSSS Inhalt des Kapitels ER 230 PIERRE A 231 ESTER pound ates a pu eae 231 a ca a ee 932 TE EN e eee 233 a 235 EEE 236 EEN 237 EE 238 orense asi ase 239 SEENEN 239 ps a a a a sean 240 A 241 PAE paca e dae ee 242 ee ee ns 242 a Er 243 EE 244 229 A Metadatens tze des HSSS A 1 Beschreibungkriterien Im folgenden Abschnitt werden die einzelnen Subelements der HSSS Metadatens tze vorgestellt getrennt nach DC Kategorien Zuerst sollen die Kriterien erl utert werden anhand denen sie sp ter detailliert beschrieben werden Kriterium KRITERIENBESCHREIBUNG Bezeichnung Kurze textuelle Beschreibung des Subelements Beschreibung l ngere Beschreibung der Funktion bzw Aussage des Subelements DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion die DC Bezeichnung des Subelements nach dem DC Standard der Name f r dieses DC Subelement der als Zugriffs Schl ssel auf den Parameter bei der bertragung durch das HTTP Protokoll verwendet wird gt m gliche Typen sind primary secondary oder system Vom Typ primary sind alle Metadaten die von Autoren der Hoch schulschrift zu erbringen sind Vom Typ secondary sind Metada ten die von Fachkr ften der Bibliothek erstellt werden Klassifi kationen etc Vom Typ system schlie lich sind Metadaten die automatisch von der Anwendung erstellt bzw vergeben werden beschreibt ob das Subel
53. Informationen in formation hiding in ganz bestimmten Klassen Im betrachteten Beispiel bestand die einzige Instanziierungsm glichkeit der Schnittstelle DBTemporalStorage in der Klas se SybaseDBtemporalStorage f r eine Sybase Datenbank W rde sich die Daten bankanbindung in Zukunft ndern oder erweitern durch zum Bsp Oracle dann m ssten nur zwei nderungen durchgef hrt werden Erstens wird mit der Klas se OracleDBTemporalStorage eine entsprechende Implementierung der Schnittstelle DBTemporalStorage und damit auch TemporalStorage geschaffen und zweitens brauchen lediglich wenige Zeilen Quellcode innerhalb von TemporalStorageFactory ge ndert bzw hinzugef gt werden W re die Instanziierung der verschiedenen Klas sen vom Typ TemporalStorage nicht durch eine Fabrik realisiert worden sondern von jeder eine solche Instanz ben tigenden Klasse selbst z Bsp 50 dann h tte die nderung auch bei jeder dieser Klassen z Bsp 50 durchgef hrt werden m ssen 107 3 Systemarchitektur 3 3 3 Architekturdetails auf Client Ebene Die Architekturdetails auf Client Ebene sind zum Teil recht abh ngig von der jeweili gen Teilanwendung weshalb solche Details dann auch in den entsprechenden Kapiteln er rtert werden sollen Au erdem wurden eine Reihe von Aussagen bereits von der Be legarbeit getroffen Schb00 Deshalb sollen an dieser Stelle lediglich eine Einordnung in die Gesamtarchitektur sowie ein kurzer Ausblick auf techn
54. Mehrheit der hier aufgef hrten Verbesserungen bzw Erweiterungen wurde bereits in Abschnitt auf Seite diskutiert der Vollst ndigkeit halber sollen sie hier trotzdem noch einmal aufgef hrt werden Die gegenw rtig benutzte explizite Abbildung von absoluten auf reale URL s ist zu berdenken und gegebenenfalls durch eine implizite Abbildung zu ersetzen Dies sollte allerdings erst bei wesentlich gr eren Datenmengen erforderlich sein wobei die Frage ist ob diese vom HSSS jemals erreicht werden Bei einer Um stellung ist darauf zu achten dass alle bereits ver ffentlichten absoluten URL s weiterhin unterst tzt werden m ssen Die Volltextsuchmaschine Lucene ist noch besser an die deutsche Sprache an zupassen Dazu sollte als erstes die innerhalb der Klasse HsssStopAnalyzer realisierte Stopwortliste auf Vollst ndigkeit berpr ft werden Zus tzlich w re die Integration eines deutschen Stemming Algorithmus f r die Suche n tzlich dieser muss allerdings sehr wahrscheinlich selbst implementiert werden Die bisher nur sehr primitiv realisierte Navigation in den Metadaten sollte deut lich erweitert werden Ein m glicher Ansatz dazu wurde in Abschnitt ge nannt Die Benutzeroberfl che myHSSS sollte zu einem Portal ausgebaut werden so dass sie der zentrale Interaktionspunkt des HSSS wird Dazu ist die persistente datenbankbasierte Registrierung in Verbindung mit Personalisierungsm glichkei ten zu realisieren Unter diesen Vorauss
55. Netzwerkinformationen DINI Die Deutsche Initiative fiir Netzwerkinformationen im Folgenden nur noch als DINI bezeichnet L DIa ist eine Initiative von vier Partnerorganisationen u a Deutscher Bibliotheksverband Sektion 4 Wissenschaftliche Universalbibliotheken und sieht es als ihre zentrale Aufgabe an angesichts der zunehmend fl chendeckenden und in ihrer Leistungsf higkeit stark ansteigenden Vernetzung sowie dem zunehmenden bergang von der traditionellen papiergebundenen Publikation und Kommunikation zu einem modernen elektronisch basierten und damit effektiven Informationsmanagement den Wandel der Informationsinfrastruktur innerhalb und zwischen den deutschen akade mischen Bildungseinrichtungen voranzutreiben Dabei steht f r die DINI der Aufbau von allgemein zugreifbaren effektiv recherchierbaren systematisch gepflegten und au thentisierten lokalen Hochschularchiven im Vordergrund Aus diesem Grund setzt sich die DINI sehr f r die Einhaltung aber auch f r die gemeinsame Entwicklung und Etablierung von Standards ein Am 12 September 2000 hat die DINI in einem DINI Appell alle Betreiber von lokalen elektronischen Archiven an deutschen Hochschulen oder F rderinstitutionen aufgerufen die Spezifi kation der OAI zu implementieren Als Begr ndung verweist die DINI in ihrem Appell darauf dass ein Gro teil der in den letzten Jahren auf Fachbereichs Hochschul oder Landesebene entstandenen elektronischen Archive nicht nach
56. Neustart des Servlet Containers auf ein JSP dieses in einem zweistufigen Prozess erst kompiliert werden muss dauert dieser erste Zugriff im Vergleich zu allen anderen relativ lange Kann man bei wenigen JSP s diese f r den Nutzer unangenehme Situation noch durch ein manuelles Ansteuern aller JSP s verhindern ist das bei gr eren Systemen wie dem HSSS mit knapp 200 JSP s schlicht unm glich Zu diesem Zweck dient das Werkzeug JSPC JSP Compiler welches alle JSP s noch vor dem Hochfahren des Servlet Containers kompilieren kann so dass diese mit der gewohnten Geschwindigkeit ausf hrbar sind Allerdings ist dieses Werkzeug bis jetzt nur sehr d rftig dokumentiert und hat bei kurzen Tests noch einige Probleme bereitet Trotzdem sollte in die Nutzung dieses Werkzeuges investiert werden da es sich um so mehr auszahlt je gr er die Gesamtanwendung wird In Abschnitt 3 3 3 1 wurden sogenannte TagLibs vorgestellt und die Vorteile auf gez hlt die der Einsatz dieser Technologie mit sich bringen w rde Zwar ist die Entwicklung von flexiblen wiederverwendbaren TagLibs nicht trivial trotzdem sollte sie in einer n chsten Ausbaustufe wenigstens getestet werden Sinnvoll ist der Einsatz grunds tzlich bei jeder der drei Teilanwendungen In einer n chsten Ausbaustufe sollten auf jeden Fall die guten Internationalisie rungsm glichkeiten von Java genutzt werden um durch entsprechende Locales verschiedene Sprachen und Formate zu unterst
57. OLE VORTEILE ASP stellt ein flexibles Konzept zur Erstellung Server seitiger Webanwen dungen dar welches sich au erdem dadurch auszeichnet dass theoretisch bis zu einem gewissen Grade eine Trennung von Layout und Applikations logik m glich ist Nicht umsonst besteht bis zu einem gewissen Grad eine hnlichkeit zwischen ASP und JSP NACHTEILE Das gro e Manko dieser Technologie ist ihre Plattformabh ngigkeit So ist sie zum einen an die Win32 Plattformen gebunden will man externe ActiveX Objecte verwenden und auch an den Webserver Microsoft Inter net Information Server Es besteht also in allen Teilen eine sehr gro e Abh ngigkeit zum Hersteller Microsoft PHP Hypertext Preprocessor PHP PHP erm glicht ebenfalls die Integration von HTML und PHP Code in eine Quelle und hat sich insbesondere bei der Entwicklung kleinerer bis mittelgro er Server seitig dynamischer Web Angebote durchgesetzt Gerade in Verbindung mit anderer Open Source Technologie wie Apache und MySQL ist der Einsatz von PHP weit verbreitet VORTEILE PHP ist Open Source Software es bestehen somit kaum Abh ngigkeiten 41Die bekanntesten Vertreter sind ISAPI Internet Server Application Programming Interface von Microsoft sowie NSAPI Netscape Server Application Programming Interface von Netscape 98 3 3 Architekturdetails PHP wird intensiv weiterentwickelt es existieren au erdem eine Vielzahl von API s f r fast jede Fu
58. Organisationen einfach ge nutzt werden kann die sich im weitesten Sinne mit dem Publizieren von Inhalten ber das Web besch ftigen Am Anfang sollen kurz einige Protokoll Begriffe definiert werden e Ein Repository bezeichnet einen netzwerkf higen Server an den in das Proto koll HTTP eingebettete OAI Protokoll Anfragen gesendet werden k nnen e Ein Record ist eine in XML kodierte Byte Folge die von einem Repository als Antwort auf eine OAI Protokoll Anfrage zur ckgesendet wird und die einem Archivinhalt eindeutig zugeordnet ist e Ein Unique Identifier ist ein Schl ssel f r den Zugriff auf die Metadaten eines durch diesen Schl ssel eindeutig bestimmten Archivinhalt des Repository e Ein Datestamp kann das Datum der Erstellung des Entfernens oder der letzten nderung eines Archivinhalts sein e Ein Set ist ein optionales Konstrukt das der Gruppierung von Archivinhalten eines Repository zum Zwecke eines selektiven Zugriffs dient Ein Repository beinhaltet eine Menge von Dokumenten digitale Archivinhalte und deren Metadaten Diese Metadaten sind ber das OAI Protokoll verf gbar Eine Anfrage an das Repository zu einem Dokument wird durch einen Record beantwortet welcher in XML kodierte Metadateninformationen ber das Element enth lt Die Record Struktur besteht aus den folgenden Teilen siehe auch Listing 1 e Dem Header Abschnitt Informationen die f r die Bearbeitung der Informa tionen notwendig sind wie z
59. Realisierung der zweiten Architekturvision im Hinblick auf eine automatisier te Erstellung dynamischer Programmteile und Arbeitsabl ufe eine zus tzliche Schnitt stelle ben tigt um die entstehende Komplexit t in den Konfigurationsstrukturen vor den Nutzern zu verbergen Die Realisierung einer solchen Schnittstelle erfordert unter Umst nden enorme Investitionen so dass die Frage gestellt werden muss ob sich ein solcher Aufwand lohnt oder ob das Komplexit tsproblem nicht nur auf eine andere Abstraktionsebene verschoben wird Architekturvision drei und vier beziehen sich auf den haupts chlich in der Di plomarbeit zu realisierenden Anwendungsteil zu dem noch keine Vorarbeit aus der Belegarbeit existiert Gegebenenfalls m ssen deshalb auch hier Einschr nkungen ge troffen werden wenn der zu erwartende Aufwand die M glichkeiten einer Diplomar beit zu berschreiten droht Die dritte Architekturvision die eine dynamische durch 2280 zum Beispiel Cache Strategien so dass die Anwendung entscheiden kann ob neue Objekte erstellt werden m ssen bzw ob schon vorhandene Objekte lediglich ver ndert zu werden brauchen und vieles mehr Die volle Umsetzung der zweiten Architekturvision in Verbindung mit der zus tzlichen M glichkeit nach demselben Muster einen relativ beliebigen Arbeitsablauf f r die Behandlung der Metada ten zu definieren f hrt zwangsl ufig zu einer hochgradig generischen und flexiblen Anwendung die einen Gro teil d
60. Ressource eine komplett neue Titelaufnahme zu erstellen wie Abbildung 11 zeigt Auflage Repr sentation 1 Auflage Repr sentation 2 idn 100000 idn 100001 200 Mustermann Hans 200 Mustermann Hans 320 Ein Titel 320 Ein Titel 334 elektronische Ressource 334 418 Dresden 418 Dresden 425 1999 425 1999 433 Online Ressource 433 II 144 S graph Darst 618 s Schlagwortl 21 3 618 Titelsatz Titelsatz Abbildung 11 Doppelte Titelaufnahme einer Ressource Diese Abbildung zeigt Ausschnitte des MAB Datensatzes zweier Repr sentationen elektronische Version Druckexemplar ein und derselben Ressource Wie ersicht lich ist liegen grofe Teile z Bsp die MAB Felder 200 320 418 des Datensat zes redundant vor Dies birgt potentiell die Gefahr von Inkonsistenzen und nicht deterministischen Suchergebnissen falls diese Felder anders als hier gezeigt eben nicht einhundertprozentig identisch sind Andere Felder sind entweder in dem einen oder in dem anderen Datensatz enthalten Felder 334 618 Bis hierhin w re der eine zweite Datensatz also eine echte Teilmenge des anderen ersten Das Feld 433 kommt in beiden Datens tzen mit jeweils unterschiedlicher Belegung vor Falls dieses Feld mehrfach belegt werden d rfte k nnten die beiden Datens tze wie in Abbil dung 12 gezeigt zusammengefasst werden Dies h tte f r das Druckexemplar sofern es noch nicht sachlich erschlossen wurde den gro en Vorteil dass
61. So kann die SLUB die URL und den Text ja beliebig ndern um beispielsweise eine Webseite mit aktuellen Neuigkeiten rund um den HSSS z Bsp http hsss slub dresden de news html mit dem Text letzte Neuigkeiten an zeigen zu lancieren 136 4 4 Zus tzliche Funktionalit ten Abbildung 38 SLUB MetadatenGenerator Fragebogen Ausschnitt 4 4 2 Status Verfolgung durch den Autor Eine weitere w nschenswerte Funktion aus Sicht des Autors ist sicherlich die ber den Stand der Bearbeitung seines Metadatensatzes aktuell informiert zu sein Zu diesem Zweck existiert eine Anwendung die es ihm erlaubt sich die aktuellen Statusinfor mationen f r seinen Metadatensatz anzeigen zu lassen Dazu muss der Anwendung selbstverst ndlich die Bearbeitungsnummer mitgeteilt werden die den Metadatensatz eindeutig identifiziert In der E Mail die der Autor gegebenenfalls als Best tigung erh lt ist unter ande rem gleich ein Link enthalten der die Bearbeitungsnummer integriert und nur noch angeklickt werden muss um sofort die aktuellen Statusinformationen des entsprechen den Metadatensatzes anzuzeigen Eine solche Statusinformation pr sentiert sich dem Autor wie in Abbildung 39 auf der n chsten Seite dargestellt Um diese Informatio nen anzuzeigen verwendet die Anwendung die Spalten der bereits vorgestellten Tabelle temp_metadatsets um direkten Zugang zu den Statusinformationen wie Bearbei tungsstatus Datum der
62. Systems eingegriffen werden muss Bei dem MetadatenGenerator sind zus tzlich viele Bereiche des Layouts sowie einige Be dingungen bei der Validierung der Metadaten einstellbar Damit geht das Design dieser Teilanwendung ber einen normalen Straight Forward Ansatz weit hinaus Auch die Implementation konnte mit Hilfe zweier Auszubildender zus tzliche Funktionalit ten realisieren die im Abschnitt 4 4 erl utert wurden Anschlie end wurde mit den AdminTools die umfangreichste der drei Teilanwen dungen realisiert Dabei konnten alle vorher spezifizierten Arbeitsabl ufe von der Teilanwendung technisch unterst tzt werden Gleichzeitig erlauben die AdminTools wichtige Teile des Systems und deren Verhalten durch die integrierten nderungsm g lichkeiten von Konfigurationsstrukturen und XSL Stylesheets zu beeinflussen Um die vielf ltigen Anforderungen an diese Teilanwendung befriedigen zu k nnen wurden ei ne Reihe von externen API s bzw Technologien integriert siehe dazu auch Abschnitt D im Anhang Innerhalb dieses Entwicklungsprozesses wurde auch das eigentliche Datenbankschema der Gesamtanwendung spezifiziert und das persistente datenbank basierte Einstellen von Metadatens tzen realisiert Danach begann mit der Realisierung der URL Abbildung die Entwicklung der drit ten Teilanwendung Die geforderten Funktionalit ten konnten dabei durch die Inte gration einer externen Volltextsuchmaschine relativ elegant realisiert werde
63. Token Um die vollst ndige Liste zu erhalten muss der Client enthaltene Sonderzeichen wie m ssen selbstverst ndlich kodiert werden 42 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld gegebenenfalls mehrfach dieselbe Anfrage inklusive des Wiederaufnahmezeigers an das Repository schicken Im folgenden sollen die wichtigsten OAI Protokoll Anfrager 4 nebst den korrespondierenden Protokoll Antworten vorgestellt werden e GetRecord Diese Anfrage wird genutzt um einen einzelnen Record eines Elementes des Repository zu erhalten Obligatorische Parameter sind der Schliissel identifier des gewiinschten Record sowie das Metadatenformat metadataPrefix welches die Antwort enthalten soll e Identify Diese Anfrage wird genutzt um Informationen iiber ein Repository zu erhal ten zusammen mit Informationen ber die Administration und die betreibende Institution Diese Anfrage ben tigt keine Parameter e ListIdentifiers Diese Anfrage wird genutzt um die Schl ssel identifier der Records zu erhal ten die ein Repository enth lt Optionale Parameter k nnen die Menge der Schl ssel einschr nken z Bsp auf Basis der Zugeh rigkeit zu einem bestimmten Set oder aufgrund der Modifikation oder Erstellung innerhalb eines bestimmten Zeitraumes e ListMetadataFormats Diese Anfrage wird genutzt um die verf gbaren Metadatenformate eines Repo sitory zu erhalten Der optionale Parameter id
64. URL s des Webservers B Gerade das k nnte aber bei einer verteilten Anwendung durchaus Sinn machen 179 6 Teilanwendung 3 HSSS AccessTools myHSSS Ansatz VORTEILE NACHTEILE 1 explizite Abbildung zwei Entit ten 2 implizite Abbildung eine Entit t Abbil dungsfkt Flexibilit t Es sind zur selben Zeit mehrere Abbildungsziele denkbar theo retisch so viele wie Abbildun gen Das bedeutet dass sich die realen URL s und damit auch der Inhalt Frontdoors und Dokumente im Pr sentationsfor mat auf mehrere physische Ser ver verteilen kann nderungen der Abbildungen m ssen auch nicht f r alle URL s gemeinsam ausgef hrt werden Skalierbarkeit Die Abbildung ist abh ngig von der Abbildungsfunktion nicht von der Gr e der Abbildungs menge vorausgesetzt die Ab bildungsfunktion ist so gew hlt dass die Abbildungsmenge nicht den Wertebereich bersteigt Performance Die Performance ist direkt und lediglich von der Abbildungs funktion abh ngig und auf kei ne externen Ressourcen oder Da tenstrukturen angewiesen Skalierbarkeit Der Aufwand und damit die Per formance der Abbildung ist ab h ngig von der Menge der m g lichen Abbildungen Damit ist dieser Ansatz zumindest nicht unbegrenzt skalierbar Performance Die Performance ist generell schlechter als bei dem zweiten Ansatz da die Infomationen zu allen Abbildungen erst be schafft werden m ss
65. Wiederaufnahmezeigers durch aktueller Zeitstempel init timestamp gt age timestamp Wenn age timestamp gr er als parts clean delay ist entferne den Wiederaufnahmezeiger und die zugeh rige Restmenge aus hash map Dieser Algorithmus erlaubt ein automatisches S ubern der Datenstruktur f r die Wiederaufnahmetoken so dass immer nur eine begrenzte Zahl aktueller Wiederauf nahmetoken pr sent ist Dabei ist die Aktualisierung der Datenstruktur durch die Thread basierte Realisierung sogar zur Laufzeit und ohne merkliche Beeintr chtigung des OAIServlets m glich Der Wert f r clean delay ist wieder in web xml konfigu rierbar Idie Datenstruktur hash map wird durch ein Semaphor gesch tzt 214 7 2 Realisierung 7 2 Realisierung Dieser Abschnitt soll sehr kurz gefasst werden und zum besseren Verst ndnis des Protokolls lediglich dessen Struktur visualisieren Abbildung 63 zeigt die Antwort auf eine OAI Identify Anfrage an die OAI Implementation des HSSS in einem XML f higen Browser A http hsss slub dresden de hsss servlet hsss oai DAIS ervlet verb Identify Microsoft Internet Explorer Fl Datei Bearbeiten Ansicht Favoriten Extras 2 EE d a 2 3 5 3 Zur ck Vomais Abbrechen Aktualisieren Startseite Suchen Favoriten Verlauf E Mail Drucken Bearbeiten Adresse fe http hsss slub dresden de hsss servlet hsss oai 0AlServlet verb Identify Wechseln zu Links El lt xml version
66. alle Metadates tze eines Archivs unter Umst nden sogar in mehreren Metadatenformaten Wenn man von einer XML Struktur ausgeht die pro Metadatensatz etwa 20 bis 100 Zeilen ben tigt und weiterhin ein Archiv mit 5000 Metadatens tzen annimmt kann man sich das Datenvolumen vorstellen das in diesem Fall ber das Netz geht 6Die OAI Befehle ListSets ListIdentifiers und ListRecords erlauben die Verwendung von Re sumtion Tokens und produzieren Ergebnisse unterschiedlichen Umfangs weshalb differenzierte Schwellwerte sinnvoll sind 212 7 1 Objektorientierte Analyse und Design miteinander in Verbindung zu bringen Innerhalb der OAI Implementation des HSSS ist dieses Problem durch das Speichern des Wiederaufnahmezeigers als Schl ssel in einer Hashtabelle gel st worden Jedem Wiederaufnahmezeiger ist dort als Wert die noch verbleibende Ergebnismenge zugeordnet Der Wiederaufnahmezeiger der auto matisch generiert wird hat dabei die folgende Form rt lt timestamp gt lt 4 digit random gt p lt count of parts gt z Bsp rt9964799925314492p4 Die beiden Anfangsbuchstaben sollen den Wiederaufnahmezeiger lediglich optisch von anderen Signaturen des HSSS leichter unterscheidbar machen der Zeitstempel ent spricht der Zahl der Millisekunden seit dem 01 Januar 1970 um 00 00 Uhr GMT die 4 stellige Zufahlszahl wird in diesem Fall durch den kryptographisch unsicheren Zu fallsgenerator im Package java util berechnet De
67. am Anfang aus vielen manuellen Schritten die nicht automatisierbar sind und den AdminTools durch das korrekte Setzen des Dokumenten Zustands in dem daf r vorgesehenen Bereich der Teilanwendung ber den Button Dokument mitgeteilt werden m ssen Zu diesen Bearbeitungsschritten geh rt das formale Vergleichen des elektronischen Dokuments mit der Druckversion was bei positivem Verlauf durch die Dokumenten Zustands nderung auf Validierung Dokument OK mitgeteilt werden sollte und das Konvertieren in das HSSS Pr sentationsformat welches zu dem Doku mentenstatus Konvertierung Dokument OK f hren sollte Diese Schritte geschehen aber vollst ndig au erhalb der Anwendung zum Beispiel auf dem lokalen Rechner eines Mitarbeiters des Referats 5 3 Sind sowohl Validierung als auch Konvertierung des Do kuments abgeschlossen ben tigt die Anwendung Zugriff auf das Dokument Zu diesem Zwecke existiert ein freigegebenes Verzeichnis auf dem Server auf dem die Anwendung tempor re Dokumente erwartet Diese Verzeichnis ist bei den Mitarbeitern des Re ferats 5 3 als entferntes Laufwerk angebunden so dass sie Dokumente entsprechend einstellen k nnen Dabei ist es m glich innerhalb des vorgesehenen Verzeichnisses weitere Unterverzeichnisse zu schaffen und somit eine strukturierte Ablage f r ver schiedene Hochschulschriften zu schaffen Dieses Verzeichnis muss der Anwendung 13 nd unter Verwendung des XSLT Prozessors Xalan der ASF siehe Anhand
68. an dem Projekt beteiligten Institutionen durch die Koordinierungsstelle DissOnline unter F hrung der Deutschen Bibliothek beraten und koordiniert werden Die Ergebnisse 20Stand Mai 2001 50 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld des Projektes werden auf einem speziellen Server L Dil pr sentiert bzw sind auch als CD ROM erh ltlich Auf diesem Server wurde eine F lle von Wissen und Informationen zusammen getragen und grob in die Bereiche Bibliotheken Doktoranden Fachbereiche und Technik untergliedert Im Bereich Bibliotheken sind vor allem allgemeine Informationen sowie Informationen ber rechtliche Aspekte Gesch ftsg nge sowie zu Schulungen und Formaten verf gbar Diese Informationen sind in erster Linie f r Bi bliotheken bzw Universit tsbibliotheken gedacht Die Kategorie Fachbereiche kon zentriert sich vor allem auf rechtliche Aspekte im Bereich der Promotionsordnung sowie auf Arbeitsabl ufe innerhalb von Fachbereichen an universit ren Einrichtungen Im Bereich Doktoranden finden speziell die Autoren wissenschaftlicher Publikationen Informationen ber rechtliche Fragen Dokumentenformate Multimediaformate und Metadaten Der Bereich Technik wendet sich insbesondere an Universit tsbiblio theken bzw Rechenzentren die als Anbieter von Diensten im Bereich elektronischer Publikationen fungieren oder solches planen
69. auf der linken Seite jeder Dublin Core Kategorie befindet kann man bequem zwischen den einzelnen Kategorien wechseln Bis auf die System Metadaten sind alle Metadaten editierbar so dass vorhandene Metadaten i d R Prim r Metadaten gegebenenfalls berichtigt und Sekund r Metadaten hinzu gef gt werden k nnen Im angenommenen Fall eines neuen Metadatensatzes w rde der Nutzer die vorhanden prim ren Metadaten auf syntaktische und semantische Kor rektheit berpr fen und anschlie end auf den nicht in der Abbildung gezeigten Button nderungen speichern klicken Auch wenn keine Ver nderungen vorgenommen wor den sind werden alle Metadaten des entsprechenden Metadatensatzes in Abh ngigkeit seines Metadaten Zustandes von den AdminTools Server seitig validiert Bei einem neuen Metadatensatz dessen Metadaten Zustand dem Ausgangszustand Validierung Prim rmetadaten entspricht w rde die Anwendung den Metadaten Zustand also je nach Ergebnis der Validierung auf Validierung Prim rmetadaten OK oder Vali dierung Prim rmetadaten Fehler mit entsprechender Fehlermeldung setzen Im ersten Fall wenn alle Prim r Metadaten korrekt validiert vorliegen erfolgt der Schritt der bermittlung der prim ren Metadaten an den jeweils zust ndigen Fachreferen ten Dazu verl sst der Nutzer das hier beschriebene Bearbeitungsfenster indem er auf Metadatens tze in der oberen Navigationsleiste klickt Er gelangt auf die anfangs beschri
70. aus Die ausschlaggebenden Gr nde daf r waren dass bei der SLUB be reits Erfahrungen in der Administration von Sybase Datenbanksystemen vorhanden waren und dass die Lizenz fiir dieses Datenbankverwaltungssystem im Rahmen der Landeslizenz noch einmal wesentlich g nstiger war Zudem w ren die zus tzlichen Fuktionalit ten des Oracle Datenbankservers f r die Anwendung nur begrenzt von Vorteil gewesen Allerdings handelt es sich bei der zu diesem Zeitpunkten aktuellen Version 12 0 des Adaptive Server Enterprise von Sybase um eine Version die sich be reits geraume Zeit am Markt befindet und in n herer Zukunft durch die nachfolgende Version 12 5 abgel st wird Diese Version bietet erhebliche Weiterentwicklungen insbe sondere in den Bereichen XML und Java Unterst tzung so dass eine Aktualisierung zur gegebenen Zeit durchaus Sinn machen w rde siehe dazu auch Abschnitt ab Seite p22 117 3 Systemarchitektur 3 3 4 3 Design der Schnittstelle Die Schnittstelle zur Datenbankanbindung soll sich nat rlich m glichst nahtlos in die Gesamtanwendung und insbesondere in die Persistenzschnittstelle die unabh ngig da von ist ob die hier betrachtete Datenbank oder eine dateibasierte L sung verwen det wird einf gen und dabei trotzdem flexibel und lose gekoppelt bleiben Abbil dung 30 zeigt die wichtigsten Klassen des Package db welches sich innerhalb des utilities Package befindet und den Zugriffspunkt auf Datenbanken f
71. ber Daten strukturen Zugriff auf externe Ressourcen etc anderen Bereichen berl sst und selbst nur die Darstellung von Information f r den Anwender bernimmt Dadurch eignet sich dieser Ansatz auch besonders um in einem Team mit unterschiedlichen fachli chen Kompetenzen parallel zu entwickeln So k nnen Details der Anwendung von Softwarearchitekten etwa in Schicht 2 oder 3 realisiert werden die dann nur noch entsprechende Schnittstellen kommunizieren bzw dokumentieren m ssen Mit Hilfe dieser Schnittstellen kann dann ein Web Designer passende Webseiten entwickeln oh ne alle Einzelheiten der Anwendung kennen oder entsprechende Programmiersprachen beherrschen zu m ssen Allerdings verbleiben in den JSP s Quellcode Teile vor allem sogenannte Script lets die Java spezifisch sind und zur dynamischen Generierung von HTML Code ge braucht werden Diese Java Anteile im Quellcode lassen sich auch dann nicht vollst n dig vermeiden wenn man sich lediglich auf Layout Funktionalit ten beschr nkt und wirken zum Beispiel f r einen Web Designer innerhalb des ansonsten HTML basierten Quellcodes entsprechend st rend Dieses Problem l sst sich durch die Verwendung von TagLibs Tag Bibliotheken umgehen welche es erlauben f r bestimmte Java Quellcode Teile Tags zu definieren die sich dann wesentlich besser und bersichtlicher in den restlichen Quellcode einpassen AAB00 Listing 7 zeigt den Unterschied for mal an einem sehr simplen Beisp
72. ber zus tzliche Funktionalit ten welche einige der Schwachpunkte des Relationenmodells zumindest entsch rfen Postrelationale bzw Objektrelationale Systeme e Die Metadatens tze des HSSS als die einzigen im Datenbank Schema abzubil denden Strukturen eignen sich hervorragend f r das Relationenmodell e RDBMS bieten ausgereifte und u erst gut erforschte Realisierungen f r Trans aktionen 116 3 3 Architekturdetails e Im Vergleich zu anderen Datenbank Technologien besteht bei RDBMS eine breite Auswahl an entsprechenden Systemen Die Wahl f llt also generell auf ein relationales Datenbankverwaltungssystem Da bei ist im Folgenden abzuw gen ob ein kommerzielles Produkt oder eine Open Source Alternative eingesetzt werden soll Die Entscheidung f llt in diesem Fall zugunsten eines kommerziellen Produktes aus weil diese Systeme im Vergleich mit Open Source Datenbanken in den meisten F llen wesentlich umfangreicher und leistungsf higer sind und zudem aufgrund existierender Landeslizenzen die M glichkeit bestand zwischen zwei kommerziellen Datenbanksystemen sehr preiswert w hlen zu k nnen Bei die sen Datenbanken handelt es sich um die Produkte von Oracle Oracle8i Database Server L OR und Sybase Adaptive Server Enterprise ASE L SY Obwohl es sich bei dem Produkt von Oracle um das aktuellere umfangreichere und auch weiter verbreitete handelt fiel die Entscheidung zugunsten des Datenbankservers von Sybase
73. besonderen Vorkommnissen als Information f r andere Bearbeiter Ein hnlicher Formularbereich innerhalb der tempor ren Metadaten existiert selbstverst ndlich auch f r den Metadatenexport nach DDB 158 5 2 Realisierung Der Metadatensatz kann nun endg ltig eingestellt werden Dabei handelt es sich um einen mehrstufigen Vorgang der dadurch eingeleitet wird dass f r den betrach teten Metadatensatz die Aktion Einstellen gew hlt wird Anschlie end erfolgt ein Hinweis dass diese Operation auf die Sichtbarkeit des Metadatensatzes sowohl inner halb der AdminTools als auch von au en gro e Auswirkungen hat Falls die R ckmel dungen f r die Exporte noch nicht vorliegen und die Wartefrist noch nicht vor ber ist gibt die Anwendung au erdem entsprechende Warnmeldungen aus Der Vorgang des Einstellens kann jedoch trotzdem fortgesetzt werden und w rde als n chstes zu der in Abbildung 46 gezeigten Ansicht f hren Abbildung 46 HSSS AdminTools Einstellen des Metadatensatzes In dieser Abbildung macht die separate Navigationsleiste noch einmal deutlich dass es sich bei dem Einstellen um einen aus mehreren sequentiellen Teilvorg ngen bestehenden Vorgang handelt der auch jederzeit durch ein Klicken auf Abbrechen abgebrochen werden kann bzw der es erlaubt bestimmte Teilvorg nge auch zu ber springen Au erdem kann ber den Button Zur ck jederzeit wieder zum voran gegangenen Teilvorgang zur ckgegangen w
74. das zur Feldsuche dienende Formular welches in Abbildung 57 normal integriert gezeigt ist ist auch eine externe Darstellung realisierbar die nur dieses Formular zeigt wie in Abbildung 58 zu sehen ist EIER TEE Ml Datei Bearbeiten Ansicht Favoriten Extras 2 a e gt fF a 315 3 RS Zur ck Vorwarts Abbrechen Aktualisieren Startseite Suchen Favoriten Verlauf E Mail Drucken Bearbeiten Adresse a http b001 02 slub dresden de hsss myhsss fieldsearch_wrapper jsp hd Wechseln zu l Links gt y zur ck y Feldsuche Ttl muss Autor joachim OR udo OR alexander muss zl Beschreibung buet muss Schlagworte ee muss Suchen R cksetzen I detailierter Report fi 0 Ergebnisgr e D von bis 3 Treffer gefunden zeige Treffer 1 bis 3 zur ck 1 weiter yi Seite 1 a 1 Dissertation Translationsaktivatoren der mitochondrialen Cytochrom b Synthese in Saccaromyces cerevisiae Membranassoziation Mutagenese und 20 Protein Wechselwirkungen von Cbsip y Autor Udo Krause Buchholz Datum 10 10 2000 weitere Titel Beschreibung Die vorliegende Arbeit besch ftigt sich mit Cbs1p und Cbs2p zwei spezifische Translationsaktivatoren der COB mRNA Im Mittelpunkt standen sowohl die weitere molekularbiologische und biochemische Charakterisierung von Cbslp als auch ein Screening von Interaktionskandidaten die mit Chslp und oder Cbs2p physikalisch wechselwirke
75. der Metadaten betreffen Validieren der Prim r Metadaten Erstellen und Validieren der Sekund r Metadaten Exportieren der Metadaten und Einstellen in die persistente Datenbasis des Systems 15Die Architektur des HSSS auf dem Abstraktionsniveau des Zusammenspiels der einzelnen Kom ponenten oder der Technologieplattform ist bereits im Gro en Beleg ausf hrlich definiert worden Schb00 und wird sich f r die Diplomarbeit nicht ndern 78 3 2 Architekturtibersicht lassen sich ber diese Schnittstelle realisieren Mit dem Arbeitstitel Access Tools wird die in der Diplomarbeit zu realisierende webbasierte Schnittstelle zur Suche und Navigation ber den Inhalten des Hochschulschriftenservers bezeichnet Das Gesamt system besitzt au erdem eine lose gekoppelte Persistenzschnittstelle Im Beleg war die Persistenzschicht dateibasiert im Rahmen des Diploms soll diese L sung beibehal ten jedoch zus tzlich um eine datenbankbasierte Persistenzl sung erweitert werden Au erdem existiert eine OAI Schnittstelle welche das OAI Metadata Harvesting Pro tocol implementiert und damit die Grundlage schafft dass das Gesamtsystem in einem Verbund von OAI Archiven als Data Provider auftreten kann Abbildung 15 zeigt das Gesamtsystem auf einem hnlich hohem Abstraktionsni veau wie die vorherige Abbildung aber mit einem anderen Fokus W hrend die vorige Abbildung sich auf die selbst zu entwickelnden Komponenten des Systems konzentrie
76. entwickelt Die alternative Version verlangt von einem Browser lediglich die Unterst tzung von HTML 2 0 und konnte sogar auf textorientierten Browsern wie Lynx getestet werden Dabei wurden Modifikationen nat rlich in erster Linie bei den View Komponenten in Form von se paraten JSP s notwendig Controller und Model brauchten aufgrund des sorgf ltigen Entwurfes nur geringf gig angepasst zu werden Vom Ablauf der Aktionen hneln sich die beiden Versionen ebenfalls stark denn es wurde darauf Wert gelegt das Layout und die Benutzerfreundlichkeit der Originalver sion so weit wie m glich zu erhalten auch wenn aufgrund der geringen M glichkeiten des Clients nat rlich an vielen Stellen Kompromisse gemacht werden mussten So pr sentiert die alternative Version ebenfalls als erstes eine Begr ungsseite bevor ein For mular mit den verf gbaren Dokumentenarten gezeigt wird Hat der Autor sich f r eine bestimmte Dokumentenart entschieden wird allerdings ein einziges gro es Formular f r alle vom Autor zu bermittelnden Metadaten generiert welches ausschnittsweise in Abbildung 40 zu sehen ist Interkulturelles Lernen als organisationale F higkeit international t tiger Unterneh d ein ressourcenorientierter Ansatz y fEngisch gt Hinzutigen CN E j I 2 I Hinzuf gen 2 Entwicklungsorientiertes Management Abbildung 40 SLUB MetadatenGenerator Light Ausschnitt 140 4 4 Zus tzliche
77. erm glicht ein automatisch inkrementier ter numerischer Wert ein noch besseres Indizieren durch die Datenbank sowohl f r Prim rschl ssel als auch f r Fremdschl ssel Da fast alle Relationen direkt oder indi rekt mit der Relation pers_metadataset zusammenh ngen wurde eine solche Identi fikationsnummer f r jede Relation des Schemas eingef hrt Als zweite grunds tzliche Struktur innerhalb des Datenbankschemas existiert die direkte N M Beziehung des Metadatensatzes zu anderen Entit ten wie Abbildung 50 verdeutlicht MetadataSet Abbildung 50 Grundlegende Schemastruktur 2 Diese Struktur wird beispielsweise von den Publikationen Ver ffentlichungen des Metadatensatzes realisiert Diese Struktur und die entsprechend dazugeh rigen Rela tionen werden nachfolgend am Beispiel der Publikationen einer Hochschulschrift de monstriert und sind im Zusammenhang mit der bereits gezeigten Relation pers_meta dataset zu betrachten pers_publication id name isbn annotation pers_publication_metadataset id publication_id metadataset_id Die Relation pers_description enth lt alle Beschreibungen zu Hochschulschriften die in verschiedenen Sprachen vorliegen k nnen Die Relation pers_description_meta dataset ist eine reine Beziehungsrelation die lediglich aus den Fremdschl sseln der beiden beteiligten Relationen pers_description und pers_metadataset und dem 24Zus tzlich ist nat rlich auch ein Datentyp anzugeben in diesem F
78. letzten Bearbeitung oder letzter Bearbeiter zu erhalten und nicht einen XML Parser bem hen zu m ssen 137 4 Teilanwendung 1 MetadatenGenerator MG SLUB MetadatenGenerator Bearbeitungsstatus Willkommen Die Seite zeigt den Bearbeitungstatus Ihres Dokuments mit der Bearbeitungsnummer 994407959125 9687 Der aktuelle Status ist gesondert hervorgehoben Bearbeitungsstatus Neu Beschreibung Metadatensatz eingegangen aber noch nie von SLUB Mitarbeiter gesichtet Statusart normal Bearbeitungsstatus Registriert Beschreibung Metadatensatz eingegangen schon einmal von SLUB MA gesichtet Statusart normal y Bearbeitungsstatus Beschreibung Statusart in Bearbeitung Metadatensatz eingegangen wird von SLUB MA bearbeitet normal Bearbeitungsstatus Beschreibung Statusart Vorgang suspendiert Aufgrund interner Gegebenheiten mu der Vorgang f r einen bestimmten Zeitraum von der Bearbeitung suspendiert werden Falls ein Fehler aufgetreten ist wird sich ein SLUB MA mit Ihnen in Verbindung setzten error Bearbeitungsstatus Beschreibung Statusart Export Die Metadaten sind erfolgreich validiert und werden jetzt zu anderen Institutionen exportiert normal Bearbeitungsstatus Beschreibung Statusart Vorgang abgeschlossen Der gesamte Vorgang wurde erfolgreich abgeschlossen Ihr Dokument ist auf dem HSSS verf gbar s
79. lt alle f r das Speichern von Indizes und Segmenten notwen digen Klassen darunter auch viele abstrakte Klassen die entsprechend erweitert werden k nnen wie etwa InputStream OutputStream oder Directory com lucene document Dieses Package enth lt alle Klassen die das Dokumentenmodell von Lucene rea lisieren das sind vor allem Document und Field com lucene analyses Dieses Package definiert eine abstrakte Schnittstelle vom Typ Analyzer welche Texte von einer Instanz des Typs java io Reader in eine Instanz vom Typ TokenStream umwandelt eine Menge geordneter Token Au erdem werden eine Reihe einfacher Spezialisierungen bereitgestellt wie etwa StopAnalyzer und eine Reihe von Filtern wie etwa PorterStemFilter com lucene index Dieses Package realisiert den Zugriff auf einen Index Daf r stehen die Klassen IndexWriter und IndexReader zur Verf gung com lucene query Dieses Package stellt Datenstrukturen zur Verf gung um bestimmte Anfrage arten abbilden zu k nnen z Bsp TermQuery PhraseQuery oder BooleanQuery Au erdem enth lt es die abstrakte Klasse Searcher als Ausgangsbasis f r alle Klassen die Suchanfragen Query in eine Sammlung von Treffern Hits um wandeln k nnen com lucene queryParser Dieses Package enth lt die Implementation eines QueryParser f r die Anfragen an Lucene Lucene benutzt ein recht simples aber flexibles Dokumentenmodell um Indexin formationen zu repr sentieren Ein Dokument Docum
80. m glich e Es ist eine Anwendung verf gbar die die Suche in den persistenten Metadaten erlaubt und nach M glichkeit auch eine Volltextsuche unterst tzt e Die Spezifikationen der OAI werden vom HSSS dergestalt implementiert dass der Hochschulschriftenserver als Data Provider auftreten kann und somit die 99 2 Aufgabenstellung Grundlagen Arbeitsabl ufe Inhalte international verf gbar sind Um diese Anforderung erf llen zu k n nen m ssen gegebenenfalls an anderen unwichtigeren Stellen Einschr nkungen hingenommen werden Damit sind fast alle wesentlichen Anforderungen an einen Hochschulschriftenserver erf llt Insbesondere sind durch die Unterst tzung des Dublin Core Metadatenfor mats sowie die Verwendung von XML Technologie die Voraussetzungen f r die Im plementation des OAI Protokolls und damit f r die internationale Verf gbarkeit des Dokumentenservers gegeben Die Implementation dieses Protokolls geh rt zu einigen erweiterten Anforderungen die f r den Hochschulschriftenserver mit Sicherheit von gro em Vorteil w ren und damit auch eine gewisse Priorit t haben die aber nicht zu den existentiellen Merkmalen geh ren und damit nur in Abh ngigkeit der zur Ver f gung stehenden Zeit realisiert werden k nnen Insofern kann f r die Realisierung w hrend der Diplomarbeit nicht garantiert werden Zu diesen Anforderungen z hlen auch die Integration von Kommunikationsprotokollen wie etwa E Mail bzw FTP und admi
81. n allerdings ist das aufgrund der Flexibilit t von XML nicht zwingend erforderlich so dass XML basierte Datenbanken aufgrund ihrer Stabilit ts bzw Performancenachteile f r den Einsatz ebenfalls nicht in Frage kommen Relationale Datenbanksysteme sind immer noch die am meisten eingesetzten Da tenbanken insbesondere dann wenn es um Stabilit t und Performance auch bei gr ten Datenmengen geht und ein nicht zu stark partitioniertes Schema zugrunde liegt was in der Regel der Fall ist Da diese Systeme vergleichsweise lang im Einsatz sind wurden sie im Verlauf der Jahre entsprechend ausgiebig optimiert und weiter entwickelt Zudem integrieren immer mehr relationale Systeme weitergehende Funk tionalit ten die teilweise stark in den Bereich objektorientierter bzw XML basierter Datenbanksysteme hineinreichen so dass auch von diesem Blickwinkel aus betrachtet die wenigen Nachteile relationaler Datenbanken kaum ins Gewicht fallen Als Daten bankverwaltungssystem innerhalb des HSSS soll daher ein relationales Datenbanksys tem eingesetzt werden was in der folgenden Aufz hlung von Vorteilen noch einmal detaillierter begr ndet wird e RDBMS sind in den Punkten Zuverl ssigkeit Stabilit t und Performance nach wie vor un bertroffen e RDBMS sind trotz des gro en Interesses an objektorientierten Datenbanken Mit te der 90 er Jahre die Systeme die im Produktionsbetrieb am h ufigsten einge setzt werden e Moderne RDBMS verf gen
82. oder sinngem bernommen wurden sind als solche gekennzeichnet Ich bin damit einverstanden dass die Arbeit ver ffentlicht wird und dass in wissenschaftlichen Ver ffentlichungen auf sie Bezug genommen wird Der Technischen Universit t Dresden vertreten durch die Professur f r Datenbanken wird ein nicht ausschlie liches Nutzungsrecht an dieser Arbeit sowie an den im Zusammenhang mit ihr erstellten Programmen einger umt Dresden den 31 Juli 2001 19 1 Einf hrung Inhalt des Kapitels 1 1 Motivation 1 2 Inhalts berblick 21 1 Einf hrung 1 1 Motivation Auch an den Bibliotheken und insbesondere an den Universit tsbibliotheken geht das digitale Zeitalter nicht spurlos vorbei In Deutschland stehen vor allem die Univer sit tsbibliotheken zu Beginn des 21 Jahrhunderts vor der gro en Herausforderung die sich rasch vollziehenden Ver nderungen und die sich bietenden technischen M g lichkeiten zu erkennen und als Chance zu begreifen sich vom Image angestaubter Archivieranstalten zu l sen und sich nach und nach zu universit ren Informations und Servicezentren zu entwickeln Wiel Dabei kann sich die gegenw rtig durch verschiedene Umst nde zunehmend eskalie rende Finanzsituation vieler Bibliotheken durchaus als positives Moment einer Ver n derung auswirken weil sie den Reformdruck enorm erh ht Auch gro e wissenschaftli che Verlage im kommerziellen Bereich stehen weltweit
83. sind Wirklicher Nutzen kann aus ihnen aber nur entstehen wenn sie der Allgemeinheit zug nglich gemacht werden Das aber geschieht nicht durch die blo e Existenz des Internets 22 1 1 Motivation Auch f r die S chsische Landesbibliothek Staats und Universit tsbibliothek SLUB im Folgenden nur noch SLUB genannt trifft diese Standortbestimmung zu Hier machte man sich etwa ab dem Jahr 1999 verst rkt dar ber Gedanken wie man in Zukunft Hochschulschriften digital verwalten und archivieren k nnte Dabei orientierte man sich an Universit tsbibliotheken bzw Universit ten die zu diesem Zeitpunkt bereits einen Dienst f r digitale Hochschulschriften anbieten konnten Da durch konnten erste Erkenntnisse gewonnen werden welche Anforderungen ein solcher Hochschulschriftenserver abdecken sollte Ab Dezember 1999 wurden diese Erkenntnisse in Zusammenarbeit mit der Profes sur Datenbanken der Fakult t Informatik der TU Dresden im Rahmen einer Belegar beit erheblich vertieft Schb00 Zus tzlich konnten Teile eines speziell auf die Belange der SLUB zugeschnittenen Hochschulschriftenservers im Folgenden nur noch HSSS genannt unter Nutzung moderner Technologien prototypisch implementiert und er folgreich getestet werden Dabei handelte es sich um Web basierte Anwendungen die die Eingabe von Metadaten durch die Autoren der Hochschulschriften unterst tzten bzw die Auswertung und Validierung derselben durch Mitarbeiter der SLUB
84. sion verwendeten Browser bei der Realisierung des Layouts teilweise unterschiedliche Aktionen notwendig sind Nachdem die Anfrage korrekt ausgewertet und behandelt werden konnte wird sie an den Aufrufer zur ckgegeben Daf r stehen der Klas se MetadataGeneratorRequestResponseManager die Methoden redirect f hrt sendRedirect aus und dispatch f hrt forward aus zur Verf gung wel che das entsprechende JSP ansprechen das als n chstes die dynamische Generierung der Nutzerschnittstelle realisiert Die Klasse MetadataGeneratorJSPCommunicator_ wird dabei benutzt um die Session basierte Kommunikation zwischen Servlet und je weiligem JSP und umgekehrt zu realisieren Dazu wird der jeweiligen Session ein Objekt vom Typ MetadataGeneratorJSPCommunicator hinzugef gt welches seiner seits Methoden zur Verf gung stellt die von den jeweiligen JSP s genutzt werden um an die entsprechenden Informationen zu gelangen Zu diesen Informationen geh ren im Fall der Teilanwendung MetadatenGenerator nat rlich in erster Linie Informatio nen zu dem jeweiligen Metadatensatz den der Anwender mit Hilfe dieser Anwendung Schritt f r Schritt erstellt Da dieser Vorgang siehe Belegarbeit Schb00 nach wie vor ein iterativer Vorgang ist entsteht in etwa die im folgenden Sequenzdiagramm in Abbildung 32 auf der n chsten Seite gezeigte Aktionsfolge Damit ist die vom Anwender zur Laufzeit ver nderbare Konfiguration der Teilanwendung Metada tenGener
85. ver Titel bersetzter Titel Av Metadatensatz Fremdschliissel v Titel Fremdschl ssel metadataset_id numeric 6 title_id numeric 6 metadataset_id references pers_metadataset id title_id references pers_title id unique metadataset id title id Tabelle A89 die Tabelle pers_title_metadataset 274 D Verwendete Technologien Produkte Inhalt des Kapitels beer AA sa A es cep de Ge ee a ec Se ETT TOC TET CC TEC CT Cer eee DT A eee ee ha Beis ie ee a ae ee Ke Gig Gates ba eee e Gee ae ese Shc bo ae Er erage She ee ee A ae eed a eae ee oceans Bek re ee N dee a ote ha ds Se et ae le ee ee le Bok ee ke a a te ee che ee ae Cpu aed ees ee eee ee a D 2 19 J3vaMaill gcc e 2 3 8 Re HE ke ai a de 2 m ws 275 D Verwendete Technologien Produkte Dieser Abschnitt soll die in das Gesamtsystem integrierten Systeme Programme bzw APT s jeweils kurz vorstellen Dazu werden die Technologien in kommerzielle und Open Source Technologien unterschieden Der Fokus liegt dabei aber eher auf den auch zahlreich wesentlich st rker vertreten den Open Source Technologien die jeweils insbesondere auch dahingehend vorgestellt werden welche Funktion sie innerhalb der Gesamtanwendung erf llen So sind zuk nf tige Entwickler in der Lage solche APT s zu aktualisieren oder auch auszutauschen D 1 Kommerzielle Technologien Produkte D 1 1 Sybase e Produktname Sybase Adaptive Server Ent
86. vom Typ MetadataSet enth lt Aggregatbeziehungen zu Objekten die jeweils ein Dublin Core Element ein Element des Metadatensatzes repr sentieren Beispielhaft ist das in der Abbildung f r das Dublin Core Element DC Contributor gezeigt und ist f r alle anderen Elemente hnlich realisiert Die Schnittstelle DC_Con tributor beschreibt das Element allgemein und wird von der Klasse DC_Contributor Generic implementiert welche bereits alle Funktionalit ten realisiert die f r DC Con tributor Elemente der Dokumentenart Bericht ben tigt werden Die Spezialisierung DC_ContributorDissertation erweitert diese Klasse f r die Dokumentenart Disser tation P Jede dieser Klassen enth lt intern weiter Aggregate aus denen die Sub Element Struktur gebildet wird Die daf r verwendeten Klassen befinden sich in der Regel in dem Package utilities welches im Abschnitt bereits vorgestellt wurde Jedes Objekt vom Typ MetadataSet und jedes Objekt das ein Dublin Core Element beschreibt wie beispielsweise Objekte des Typs DC_Contributor implemen tieren dar berhinaus die Schnittstelle XMLNode deren einzige Methode createNode von den Klassen entsprechend berschrieben wird so dass sie eine XML Repr sentation liefert Die Klasse SubElement enth lt alle Informationen die zu einem Sub Element aus der Metadatensatzbeschreibung ber MetadataSetData gewonnen werden k n nen und stellt entsprechende Methoden wie etwa getParameterName
87. vor der Aufgabe ihre Gesch fts felder neu auszurichten und zunehmend auf Mehrwertdienste au erhalb des Vertriebs von wissenschaftlichen Publikationen auf herk mmlichem Wege Zeitschriften etc zu orientieren so etwa auf Information Retrieval oder Publishing on Demand Systeme Diesen Anforderungen werden sich auch die Bibliotheken stellen m ssen Zu ihren wichtigsten Aufgaben wird schon in naher Zukunft vor allem die Bereitstellung neu er wissenschaftlicher Erkenntnisse in elektronischer und leicht recherchierbarer Form geh ren Dazu ist der Betrieb professioneller Dokumentenserver und Suchmaschinen notwendig aber auch die organisatorische Bew ltigung von Begutachtung und Zertifi zierung der Ver ffentlichungen F r die Politik insbesondere das Bundesforschungsministerium kommt es darauf an die Bibliotheken bei der gro en Herausforderung einer organisierten fl achende ckenden Realisierung dieser Infrastrukturen so effektiv und vor allem so schnell wie m glich zu unterst tzen Die Meinung dass das Internet die Universit tsbibliotheken berfl ssig mache ist schlichtweg unsinnig Richtig aber ist dass sich die Bibliothekare zunehmend von Sammlern zu J gern also von Archivaren zu Informationbrokern entwickeln m ssen Sie00a Noch mehr muss sich die Erkenntnis durchsetzen dass es sich bei den wissenschaftlichen Publikationen um reale Werte handelt die nicht zuletzt auch durch staatliche F rdermittel entstanden
88. vorgenommen werden die durch die Operation optimize der Klasse IndexWriter eingeleitet wird und eine schnellere Suche erm glicht Allerdings ist diese Optimierung eine teure Operation die nur dann aufgerufen werden sollte wenn der Index eine Zeit lang unver ndert bleibt und nur f r die Suche verwendet wird Die Suchanfragen die jetzt an Lucene f r den erstellten Index bermittelt werden k nnen m ssen einer bestimmten Syntax gen gen Die Syntaxdefinition f r Suchanfragen wird auf der folgenden Seite gezeigt 189 6 Teilanwendung 3 HSSS AccessTools myHSSS Query Conjunction Clause Modifier BasisClause PrefixQuery Phrase Boost Term FieldName Clause Conjunction Clause AND OR Modifier FieldName BasisClause Boost gt 9 P NOT Term Phrase PrefixQuery Query Term Term gt lt Dezimalzahl gt lt Dezimalzahl gt lt gesuchtes Wort bzw Token gt lt Name eines indizierten Feldes gt Eine Suchanfrage die dieser Syntax entspricht wird von einem QueryParser in eine interne Repr sentation umgewandelt die dann an eine Instanz der Klasse IndexSearcher bergeben werden kann Diese nimmt die eigentliche Suche im Index vor und liefert eine Instanz vom Typ Hits welche die Ergebnismenge repr sentiert Mit Hilfe dieser Ergebnismenge k nnen die einzelnen Treffer ausgewertet und auf ent sprechende Feldinhalte
89. y eindeutige Identifikationsnummer f r die Tabelle name varchar 100 y Bezeichnung des Dokumententyps in nerhalb der Dokumentenart kindofdocument_id numeric 4 y Dokumentenart Fremdschl ssel kindofdocument_id references pers_kindofdocument id unique name Tabelle A78 die Tabelle pers_type pers_title Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle title text y Titel language_id numeric 5 y Sprache des Titels Fremdschl ssel Language_id references pers_language id Tabelle A79 die Tabelle pers_title 270 C 2 Schema pers_metadataset Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV v y eindeutige Identifikationsnummer f r die Tabelle processingid char 20 y eindeutige Bearbeitungsnummer des Metadatensatzes identifier virtual varchar 255 y absolute virtuelle URL identifier real varchar 255 J reale URL language_id numeric 5 Y Sprache der Hochschulschrift Fremd schl ssel type_id numeric 4 y Dokumententyp Fremdschl ssel publisher_id numeric 4 Y Universit tsbibliothek Ver ffentlicher Fremdschl ssel contributor_id numeric 5 y universit re Elnrichtung Fremdschl s sel rights_id numeric 4 y rechtliche Bedingungen Fremdschl s sel Language_id references pers_language id type_id references pers_type id publisher_id references pers_publishe
90. zum einen kann der Index aus allen in der Datenbasis enthaltenen Dokumenten komplett neu aufgebaut werden zum an deren k nnen an einem vorhandenen Index inkrementelle Ver nderungen Dokument ndern neues Dokument hinzuf gen vorgenommen werden Beide Aktionen sind un abh ngig davon ob die Datenbasis dateibasiert oder datenbankbasiert realisiert ist Im ersten Fall w rde man den LuceneManager innerhalb eines eigenen Threads instanzi ieren um die Gesamtanwendung m glichst wenig zu belasten Dieser Komplettaufbau sollte in regelm igen Abst nden im Rahmen der Wartung des HSSS durchgef hrt werden Das inkrementelle Hinzuf gen von Dokumenten zum Index kann ber eine ffentliche Methode ebenfalls von au en geschehen und wird vor allem von der Teilan wendung AdminTools im Zuge des Einstellens von Metadatens tzen genutzt Da die H ufigkeit und der Zeitpunkt der Aufrufe dieser Methoden f r den LuceneManager nicht vorauszusehen sind wird der Index nach jeder Operation optimiert Der zweite Funktionsbereich des LuceneManagers ist die Realisierung der von den AccessTools zu unterst tzenden Suchen Dazu bietet diese Klasse eine Reihe von Me thoden an welche die internen Funktionen von Lucene transparent f r die Anwendung kapseln Zu realisieren sind dabei vor allem die Volltextsuche sowie die Feldsuche Um die Ergebnisse vom LuceneManager zu erhalten muss die dritte Teilanwendung ledig lich die passende Methode aufrufen und die entspre
91. 0 HSSS Metadatensatz Name der universit ren Einrichtung Bezeichnung ADRESSE DER UNIVERSIT REN EINRICHTUNG Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Adresse der Institution die f r die Erstellung bzw die Bewertung der Hochschulschrift verantwortlich ist der Ort ist ausreichend DC Contributor CorporateName Address de _contributor _corporatename address primary mandatory 1 1 10 255 Tabelle A22 HSSS Metadatensatz Adresse der universit ren Einrichtung Bezeichnung GUTACHTER Beschreibung Die Gutachter der Hochschulschrift DC Bezeichnung DC Contributor Referee Parametername dce_contributor_referee Metadatentyp primary Regulation mandatory Dissertation nicht vorhanden Bericht H ufigkeit 1 10 L ngenrestriktion 5 60 Tabelle A23 HSSS Metadatensatz Gutachter 237 A Metadatens tze des HSSS Bezeichnung BETREUER Beschreibung DC Bezeichnung Der die Betreuer der Hochschulschrift DC Contributor Advisor Parametername dc_contributor_ advisor Metadatentyp primary Regulation mandatory Dissertation nicht vorhanden Bericht H ufigkeit 1 1 L ngenrestriktion 5 60 Tabelle A24 HSSS Metadatensatz Betreuer A 2 7 DC DATE Bezeichnung TAG DER M NDLICHEN PR FUNG Beschreibung Datum der Promotion i S der Promotionsordnung i d R ist das DC Bezeichnung Parametername Meta
92. 1 dargestellte bersichtsseite zur ck Wie dem ab gebildeten Formular zur Benutzerverwaltung zu entnehmen ist unterscheidet die An wendung zwei Arten von Nutzern normale Nutzer und solche mit Administrations Privilegien wie im betrachteten Fall Nutzer mit Administrationsrechten k nnen neben dem eigenen Account auch andere Accounts ndern und l schen bzw neue Accounts erstellen Sie sind zus tzlich durch ein Administrationssymbol in der linken unteren Ecke neben dem Benutzernamen gekennzeichnet Gew hnliche Nutzer haben im Unterschied zu Administrations Benutzern zu bestimmten Administrationsformu laren keinen Zutritt so zum Beispiel auch f r das in der Abbildung 48 dargestellte durch die Aktion Konfiguration erreichbare Formular Hier k nnen alle in Ab schnitt bzw B beschriebenen Konfigurationsstrukturen angezeigt bearbeitet und zur ckgespeichert werden unabh ngig davon ob diese dateibasiert oder daten bankbasiert verwendet werden Eine nderung von web xml w rde aber erst nach einem Neustart des Servlet Containers wirksam werden was von den AdminTools aus durch die Aktion Start amp Stop m glich ist Die anderen Konfigurationsstrukturen werden in der Regel beim n chsten Zugriff eines Clients wirksam und k nnen durch 163 5 Teilanwendung 2 AdminTools die Aktion Reload sogar in die aktuellen Sitzungen bernommen werden Die XML basierten Konfigurationsstrukturen m ssen von den berech
93. 130 4 2 Realisierung Die Wahl einer der in Abbildung 34 gezeigten Dokumentenarten durch den Autor muss zeitlich als erstes geschehen da von dieser Wahl viele weitere interne Schritte des MetadatenGenerators abh ngen Durch das Klicken auf Weiter gelangt der Autor zum n chsten Formular das in Abbildung 36 gezeigt wird Interkulturelles Lernen als organisationale F higkeit international t tiger Unterneh Abbildung 36 SLUB MetadatenGenerator Formular 2 Dies ist das erste einer Reihe von hnlichen Formularen mit deren Hilfe der Autor nach und nach seine Metadaten an das Gesamtsystem bermitteln kann Die einzelnen Elemente bzw Subelemente sind dabei sehr bersichtlich und zusammenh ngend angeordnet Dabei werden obligatorische bzw optionale Felder durch unterschiedliche Farbgebung markiert Die Eingaben des Autors werden durch JavaScript Funktionen bereits validiert sobald der Weiter Button aktiviert wurde also noch bevor die Daten an den Controller bermittelt werden falls der Autor diese Voreinstellung nicht deaktiviert hat Dieses Vorgehen hat den Vorteil dass der Autor im Fehlerfall sofort informiert werden kann und somit die Chance hat die Fehler zu berichtigen bevor diese auf der Server Seite erkannt werden wo selbstverst ndlich auch noch einmal validiert wird Dies erspart im Fehlerfall unn tige Kommunikation zwischen Client und Server Hat der Autor alle relevanten Metadaten in die verschiedene
94. 14 gepatcht mid mod ssl openSSL e Homepage http www apache org e Beschreibung Der Apache Webserver ist der am weitesten verbreitete Webserver etwa 60 Marktanteil und gleichzeitig eines der gr ften und erfolgreichsten Open Source Projekte 277 D Verwendete Technologien Produkte e Einsatzbereich innerhalb des Gesamtsystems Der Apache Webserver dient zur Auslieferung von statischen Webseiten an die Clients Browser F r die Unterst tzung von SSL wird mod sss verwendet was auf Win32 Systemen aber nicht zufriedenstellend funktioniert Hier sollte die Version 2 0 von Apache abgewartet werden D 2 3 Tomcat Produktname Tomcat Version 3 1 2 Homepage http jakarta apache org tomcat index html Beschreibung Tomcat ist ein Servlet Container und gleichzeitig die Referenzimplementation f r die von SUN spezifizierten Technologien Servlets und Java Server Pages JSP Tomcat ist wie Apache ein Open Source Produkt und wird von der Apache Software Foundation ASF entwickelt Einsatzbereich innerhalb des Gesamtsystems Der Webserver Apache interagiert ber das Modul mod_jk so dass Tomcat alle dynamischen Webinhalte serverseitig und javabasiert realisiert D 2 4 Lucene e Produktname Lucene e Version 1 01b e Homepage http www lucene com 278 D 2 Open Source Technologien Produkte e Beschreibung Bei Lucene handelt es sich um eine javabasierte Vol
95. 2 Anschlie end werden die Prim r Metadaten des Autors validiert 3 Dies geschieht mit Hilfe einer Administrationsanwendung die hier mit Admin Tools be zeichnet wurde Diese Anwendung sollte alle weiteren Schritte des Arbeitsablaufs soweit m glich technisch unterst tzen Drei der f nf vom Autor in gedruckter Form abzugebenden Pflichtexemplare seiner Dissertation werden an das Referat 3 4 mit dem Vermerk Zu diesem Dokument ist in K rze eine elektronische Version verf gbar verschickt 4 Auf diesen Vermerk wird zu einem sp teren Zeitpunkt bei der Erl u terung eines weiteren Sequenzdiagramms n her eingegangen Vom Referat 3 4 erh lt 67 3 Systemarchitektur der Autor eine Empfangsbest tigung die er zum Frhalt seiner Promotionsurkunde be n tigt 5 Mit dieser Best tigung ist der Arbeitsablauf aus Sicht des Autors vorerst beendet Au erdem f hrt das Referat 3 4 eine Reihe von Bearbeitungsschritten durch die in einem gesonderten Diagramm beschrieben werden 6 Als n chstes schickt das Referat 5 3 zwei Druckexemplare sowie eine Zusammenfassung der Prim rmeta daten an den jeweiligen Fachreferenten des entsprechenden Referats der Abteilung 11 7 Gegebenenfalls kann diese Aktion auch in Verbindung mit der Administrations anwendung erfolgen Der Fachreferent nimmt die entsprechende Sacherschlie ung und Standortbestimmung f r die beiden in der SLUB verbleibenden Druckexemplare vor und erstellt die sekund r
96. 2 Uhr Aspects of quantum radiation 994076596640 3602 02 07 2001 um 14 42 32 Uhr Metadatensatz Dokument Bearbeiten Drucken R cksetzen ExportDDB_ Export SWB L schen Einstellen Armada _Abmaisen Beenden Liese Matas MetadetonGereretor Titel Bearbeitungsnr Status Eingangsdatum letzte Bearb C sdfefsdesdfesidesdfesdfedsfesdfe 995025591349 7150 Neu 13 07 2001 um 14 00 24 Uhr C sddsfdasadfadfdsfsdafdsfsdafsdafsad 995021638695 7839 Neu 13 07 2001 um 12 54 27 Uhr C ghighighigihgjhghjgihghjgjh 994935757593 6811 in Bearbeitung 12 07 2001 um 14 05 57 Uhr C efdddddddddddddddddd 994673022328 7973 in Bearbeitung 12 07 2001 um 14 26 09 Uhr C Environmental Performance Measurement als Instr A 994153006984 7296 Neu 03 07 2001 um 11 44 12 Uhr C Projekt Oko Audit an der TU Dresden erste Erg Y 994148802375 6157 Neu 03 07 2001 um 10 53 52 Uhr Metadatensatz Dokument Bearbeiten Drucken R cksetzen ExportDDB_ Export SWB L schen Einstellen Metadatens tze aktuelle eingestellte _ Aktualisieren Abbildung 41 HSSS AdminTools bersicht der Metadatens tze Die Metadatens tze sind geordnet in der Reihenfolge ihres Eintreffens bzw der letzten Bearbeitung Sie verbleiben solange in dieser Ansicht bis sie durch die Admin Tools endg ltig persistent eingestellt wurden Dabei werden wie aus der Abbildung ersichtlich wird die e
97. 3 3 1 1 Bearbeitungsnummer F r die Behandlung der Metadatens tze ben tigt die Anwendung eine eindeutige Bear beitungsnummer um diese unterscheiden zu k nnen Eine solche Bearbeitungsnummer ist nicht nur w hrend der Bearbeitung der Metadatens tze sinnvoll sondern kann auch f r viele andere Zwecke genutzt werden wo die eindeutige Unterscheidung der Meta datens tze notwendig ist so zum Beispiel zur Erstellung einer eindeutigen Verzeich nisstruktur oder zur Generierung der absoluten URL Auch f r Exportinformationen kann diese Bearbeitungsnummer verwendet werden da die externen Institutionen in der Regel ebenfalls eine Identifikation ben tigen die innerhalb des jeweiligen Archivs eindeutig ist Eine Bearbeitungsnummer innerhalb des HSSS setzt sich aus zwei Teilen zusam men Zum einen wird ein Zeitstempel benutzt wie er von vielen Systemen her bekannt ist Dieser besteht aus den Millisekunden die seit dem 01 Januar 1970 um 00 00 Uhr GMT vergangen sind Dieser Wert ist sehr einfach zu erstellen und relativ eindeutig und hat zus tzlich den Vorteil dass er eine verwertbare Information in sich tr gt Allerdings besteht bei einem verteilten System wie dem HSSS die theoretische M g lichkeit dass sich solche Bearbeitungsnummern gleichen wenn sie zuf llig zur selben Zeit erstellt wurden oder ungl cklicherweise in dem Zeitabstand der dem Unterschied der beiden lokalen Systemzeiten entspricht Diese Wahrscheinlichkeit soll durch die I
98. 4 2 4 2 1 Ziele der Arbeitsgruppe Elektronisches Publizi Ad Inhaltsverzeichnis 2 4 2 2 Anforderungen an einen Hochschulschriftenserver 46 2 4 2 3 Einsch tzung und Wertung 50 2 4 3 Dissertationen Online 50 61 ae Sues re Bes 62 3 1 1 Gesch ftsmodell f r Dissertationen 64 3 1 2 Arbeitsablauf f r Berichte o 64 2 4 1 4 ewe we 71 Ste ee E ee 73 3 2 Architektur bersicht A 0 a eee as zus aaa an 78 Sie u rd ee ieh A 80 3 2 2 Vorgehensweise Priorisierung 22220 88 3 3 Architekturdetails 34 42 22 42 4 2 8 nis A A 44 4 91 3 3 1 Architekturbesonderheitenl 92 3 3 1 1 Bearbeitungsnummer 92 3 3 1 2 Konfigurationsstrukturen 94 3 3 2 Architekturdetails auf Server Ebenel 96 3 3 2 1 Technologische Alternativen 97 3 3 2 2 Objektorientierte Analyse und Design 99 3 3 2 3 Architektur und Entwurfsmuster 105 3 3 3 Architekturdetails auf Client Ebenel 2 2 2 2 2 108 3 3 3 1 Einordnung in die Gesamtarchitektur 108 3 3 3 2 Technologische Alternativen 111 DE SE 113 3 3 4 1 Schema und Datenbankanforderungen 114 3 3 4 2 Datenbank Evaluation 115 3 3 4 3 Design der Schnittstelle 118 Inhaltsverzeichnis 4 Teilanwendung 1 Metadat
99. B zu bergeben um sie langfristig und gut erschlossen weltweit verf gbar zu machen Hierf r galt es vor allem die technischen Vorausset zungen zu schaffen indem am Anfang die m glichen technischen bzw konzeptionellen Alternativen einer Realisierung verglichen wurden Au erdem war eine Anwendung prototypisch zu entwickeln die es den Autoren von Hochschulschriften erlaubt die Metadaten zu ihren Dokumenten m glichst bequem an die SLUB zu bermitteln Zu den wichtigsten Ergebnissen des Beleges z hlen deshalb die grunds tzlichen Technologieentscheidungen die ausf hrlich begr ndet wurden und in der Regel auch f r die Diplomarbeit verbindlich sind Zu diesen Technologieentscheidungen geh rt die Wahl der Entwicklungsplattform Java sowie der auf dieser Entwicklungsplattform basierenden API s f r die Implementation von webbasierten Anwendungen Servlet API JSP und der Komponenten f r deren Realisierung Apache Webserver Tomcat Servlet Container Schb00 Alle genannten Komponenten werden nach wie vor auch im Rahmen des Diploms in dieser Form Verwendung finden Aber auch Antworten zu inhaltlichen Fragen wie Organisationsabl ufe Leistungsumfang eines Hochschul schriftenservers sowie Integrationsanforderungen und m glichkeiten z hlen zu den Er gebnissen des Beleges Zus tzlich zu diesen grundlegenden Erkenntnissen liefert die Belegarbeit jedoch noch weitere Ergebnisse in Form von prototypisch implementierten Teilanwendungen die in
100. BLISHERS gt lt HsssData PUBLISHERS gt Informationen zur Universit tsbibliothek SLUB e lt HsssData EXPORT gt lt HsssData EXPORT gt Informationen zum Metadatenexport Name der Institutionen SLUB Informationen wie Identifikationsnummern bei der jeweiligen Institution Zieladresse des Ex ports Wartezeit auf Best tigung usw siehe dazu auch Kapitel C im Anhang ab Seite 253 B Konfigurationsstrukturen des HSSS e lt HsssData REALSTRUKTURES gt lt HsssData REALSTRUKTURES gt Informationen zu Serverbezeichnungen und Verzeichnisstrukturen der Gesamt anwendung Dokumentenverzeichnis Spiegelverzeichnis Tempor res Verzeichnis etc e lt HsssData STATES gt lt HsssData STATES gt Die m glichen Zust nde des HSSS entscheidend f r die AdminTools Unter teilt werden Zust nde in Dokumenten Zust nde type document Zustand der Dokumentenbearbeitung Metadaten Zust nde type metadata Zustand der Metadatenbearbeitung und Gesamtzust nde type overall welche sich aus den ersten beiden Zust nden ableiten und auch nach au en sichtbar sind 254 B 4 MetadataSetDissertation xml MetadataSetBericht xml B 4 MetadataSetDissertation xml MetadataSetBericht xml Die Konfigurationsstrukturen MetadataSetDissertation bzw MetadatSetBericht beschreiben die Metadatens tze der jeweiligen Dokumentenart und sind sich struktu rell sehr hnlich weshalb sie an dieser Stel
101. Bei spiel daf r l sst sich der letzte Gesamtzustand Vorgang abgeschlossen verwenden Voraussetzung f r diesen Zustand sind wie gezeigt der Metadatenzustand Validie rung Sekund rmetadaten OK und der Dokumentenzustand Dokument OK was sicherlich einsichtig ist da ein korrektes Dokument im Pr sentationsformat und ein vollst ndiger Metadatensatz Voraussetzung f r ein Einstellen und Ver ffentlichen der Hochschulschrift ist Daneben gibt es allerdings noch weitere aus dem jeweiligen Ge sch ftsmodell der Dokumentenart ableitbare Bedingungen So sind beispielsweise f r die Dokumentenart Dissertation mit dem Metadaten Export zum SWB S dwest deutscher Bibliotheksverbund und zur DDB Die Deutsche Bibliothek zwei weitere Voraussetzungen gegeben Diese betreffen ndern aber weder den Zustand von Do kumenten noch den von Metadaten Aus diesem Grund werden diese Bedingungen nicht innerhalb der Zustandbeschreibung sondern in einem separaten Bereich der Konfigurationsstruktur hsssdata xml beschrieben der sich speziell auf den Me tadatenexport bezieht siehe auch Abschnitt B im Anhang Listing 8 zeigt auf der folgenden Seite den entsprechenden Ausschnitt aus hsssdata xml Hier sind alle Export Institutionen SWB DDB und die f r den HSSS relevanten Parame ter aufgef hrt Diese beschreiben auf welche Art target der Export durchgef hrt wird und welche Identifikationen die Teilanwendung bei den jeweiligen Inst
102. Diplomarbeit im Studiengang Informatik Ein Hochschulschriften Server f r die SLUB Dresden Weboberfl che f r Browsing und Recherche vorgelegt von Sebastian Schulz geb am 07 05 1976 in Frankfurt Oder Matrikelnummer 2417475 angefertigt an der Professur f r Datenbanken Institut f r Systemarchitektur Fakult t Informatik Technische Universit t Dresden betreuender Hochschullehrer Prof Dr Klaus Meyer Wegener betreuende Mitarbeiter Dr Bernd Keller TU Dresden Dagmar Wohlfarth SLUB Dresden J rgen Grothe SLUB Dresden Beginn der Arbeit 01 11 2000 Abgabe der Arbeit 31 07 2001 Inhaltsverzeichnis Inhaltsverzeichnis 3 Abbildungsverzeichnis 9 Tabellenverzeichnis 13 17 19 Einf hrung 21 1 1 Motivation e 22 1 2 Inhalts berblick e 24 Aufgabenstellung Grundlagen Arbeitsabl ufe 27 2 1 Aufgabenstellung der Diplomarbeit 28 2 2 Interpretation der Aufgabenstellung 30 2 3 R ckblick aut den Gro en Beleg 33 2 3 1 Anforderungen und Ergebnisse der Belegarbeit 33 2 3 2 Verbesserungsm glichkeiten o 34 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umteldi s es oe aoe estr aoe a AE NEE e a E ng 36 2 4 1 Open Archives Initiative OAI 38 2 4 1 1 Protocol for Metadata Harvesting 40 2 4 2 Deutsche Initiative f r Netzwerkinformationen DINI 4
103. Disketten kaum noch Laufwerke verf gbar die diese lesen k nnen 8Quelle National Media Laboratory Kodak 1998 Universal Preservation Format UPF http info wgbh org upf 37 2 Aufgabenstellung Grundlagen Arbeitsabl ufe Der Aufbau eines Dokumentenservers und eines digitalen Archives mit Blick auf die angesprochenen Schwierigkeiten dessen Betrieb und die Einf hrung einer geeigneten Ablauforganisation in den einzelnen Universit tsbibliotheken sind aber nur der Anfang Die dergestalt entstandenen dezentralen Systeme ben tigen gemeinsame Schnittstellen und ein gemeinsames Protokoll um ber sich selbst hinaus bergreifend von Nutzen zu sein Damit das auch im Nachhinein mit einem vertretbaren Aufwand m glich ist sollte bei dem Aufbau der entsprechenden Systeme von Anfang an darauf geachtet werden dass so weit wie nur irgend m glich etablierte Standards ber cksichtigt und proprit re L sungen vermieden werden F r die Definition solcher Standards die insbesondere den f r Bibliotheken interessanten technischen Bereich abdecken gibt es eine Reihe von Organisationen und Initiativen die im Folgenden kurz vorgestellt werden sollen 2 4 1 Open Archives Initiative OAI Die Open Archives Initiative OAI L OAb hat sich zum Ziel gesetzt Standards f r die Zusammenarbeit Kommunikationsf higkeit und den Datenaustausch zu entwi ckeln die es erlauben digitale Inhalte effizient auszutauschen und zu verbreiten Seine
104. Foundation ASF L AP der erst die Server seitige Ausf hrung der Anwendungen erm glicht Das Zusammenspiel von Apache und Tomcat wurde in ausf hrlich beschrieben Auf dem Servlet Container setzen die f r den HSSS entwickelten Servlets bzw Java ServerPages JSP s auf welche ebenfalls mit der in Java realisierten HSSS Gesamtanwendung interagieren welche wiederum ber einen entsprechenden JDBC Datenbanktreiber auf die Datenbank zugreifen kann Die folgenden Abschnitte dieses Kapitels beschreiben die Architektur des HSSS etwas mehr im Detail wobei der Fokus selbstverst ndlich auf den eigenen Entwick lungen im Bereich der Java basierten Gesamtanwendung der Servlets respektive Java ServerPages bzw des Datenbankschemas liegt Zun chst werden jedoch Architekturvi sionen vorgestellt welche die Vorstellung von einem idealen Gesamtsystem vermitteln sollen und dadurch m gliche Schwerpunkte f r den anschlie enden Entwurfsprozess aufzeigen 3 2 1 Architekturvision Die hier vorgestellten Architekturvisionen betrachten die Gesamtanwendung und vor allem deren Entstehungsprozess und diverse Architekturdetails vorerst v llig losgel st von praktischen Gesichtspunkten wie etwa der Realisierbarkeit Da es sich um Visio nen handelt ist das auch nicht notwendig Erst der sich anschlie ende Abschnitt wird die entstandenen Visionen auf ihre Praxistauglichkeit und Realisierbarkeit ihren Nut zen und ihre Kosten hin berpr fen und gegeb
105. GML Author for Word und einer speziellen DiML Konvertierungsdatei nach SGML DiML konvertiert Daraufhin wird die entstandene DiML Datei durch verschiedene Perl Skripte nachbearbeitet unter Umst nden ist auch eine manuelle Nachbearbeitung und Fehlerbeseitigung erforderlich Die am Ende die ser Bearbeitungskette entstandene der DIML DTD entsprechende SGML Datei dient nun als Ausgangsformat f r die Generierung weiterer Zielformate wie zum Beispiel HTML oder PDF Die DiML Struktur l sst sich grob in die Hauptbestandteile lt front gt Deckblatt lt body gt Textk rper und lt back gt Anh nge einteilen Dabei beinhaltet das Deckblatt alle Metadateninformationen die ber die Dissertation selber festgehal ten werden Listing 3 zeigt beispielhaft ein Deckblatt in DiML Der Textk rper 21Die DiML DTD liegt bereits in der Version 2 0 L Di vor 22S0 enth lt die Formatvorlage u a Dokumentauszeichnungen wie berschriften Listen Tabellen usw Wird in der Formatvorlage beispielsweise berschrift gew hlt so erh lt der entsprechend folgende Text im Originalformat z Bsp die zus tzliche Formatanweisung diml_ headline Aus dieser zus tzlichen Formatanweisung kann dann bei der Konvertierung in das DiML Format z Bsp das Fragment lt head gt text lt head gt entstehen stark vereinfachtes fiktives Bei spiel 52 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld
106. Ge sch ftsobjekt Universit t wird beispielsweise innerhalb des Dublin Core Elements DC Contributor ben tigt und wird hier durch die Klasse UniversityInstitution repr sentiert welche ihrerseits von der Klasse Institution abgeleitet ist und zus tz lich drei Aggregate diesen Typs enth lt n mlich department Fachbereich faculty 44 N here Informationen zu dieser Klassenstruktur liefert der sich anschlie ende Abschnitt 3 3 2 3 ab Seite 102 3 3 Architekturdetails Fakult t und institute Institut Au erdem enth lt jede Institution ein Aggregat vom Typ Address Adresse also auch die Universit t Nach diesem objektorientier ten Ansatz setzen sich die meisten Gesch ftsobjekte aus mehreren primitiven Klassen zusammen die somit aber auch f r andere Zwecke wiederverwendbar bleiben InstitutionSet Comparable Serializable Institution Address institutionSet SortedSet null InstitutionSet addInstitution t Institution boolea removelnstitution t Institution bo clearlnstitutions void setinstitutionSet o InstitutionSet Institution Address Institution s String Address place String compareTo o Object int country String institutionName String state String address Address place String street String telefon String count int institutionSet lterator HsssError UniversityInstitution UniversityInstitution id String Exception hortDescription Strin HsssException universi
107. Gleichzeitig wird das Dokument in ein hnlich strukturiertes Verzeichnis au erhalb des Webservers ko piert Dabei handelt es sich um eine Art Spiegelverzeichnis welches dazu dient neben dem Pr sentationsformat auch alle anderen von der Hochschulschrift vorhande nen Formate zu archivieren Dieses Verzeichnis wird auch im Rahmen einer Backup Strategie regelm ig gesichert Nach diesem Teilschritt wird ein weiteres Formular pr sentiert welches darauf hinweist dass der Einstellvorgang jetzt beendet wird Mit der Ausf hrung der n chsten Schritte die innerhalb einer Transaktion ablaufen ist das Einstellen endg ltig und demzufolge auch nicht wieder r ckg ngig zu machenf6 Bei diesen transaktionalen Schritten handelt es sich um die im Folgenden aufgez hlten e Der Metadatensatz mit Ausnahme der tempor ren Metadaten wird unter Zu hilfenahme entsprechender Klassen und einiger gespeicherter Prozeduren auf der Datenbankseite in die Datenbasis eingestellt siehe dazu auch Abschnitt 5 3 Dazu wird vorher durch eine spezielle gespeicherte Prozedur gepr ft ob der Me tadatensatz schon existiert und dieser gegebenenfalls gel scht Dies ist notwen dig weil die Teilanwendung Admin Tools ebenfalls erm glicht bereits eingestellte Metadatens tze zu bearbeiten und anschlie end erneut einzustellen e Anhand der vorhandenen Metadaten werden in einer bestimmten Tabelle stat_ metadatasets siehe auch Abschnitt C im Anhang statistische
108. Hier finden sich Informationen zu den Themen Gesch ftsg nge Dokumentenformate Metadaten Recherche und Sicherheit Die Pr sentation der Informationen ist sehr gelungen und wirkt u erst durchdacht In Hinblick auf den HSSS ist der Bereich Technik von besonderem Interesse Viele der hier verf gbaren Informationen finden sich in etwas gek rzter Form in dem bereits beschriebenen Empfehlungen der DIN Arbeitsgruppe Elektronisches Publizie ren und sollen aus diesem Grund nicht noch einmal betrachtet werden Stattdessen wird im folgenden Abschnitt ein f r die Zukunft sehr wichtiger Teil im Gesch ftsgang elektronischer Publikationen betrachtet die Verwendung spezieller Formatvorlagen die es letztendlich erlauben sollen Metadaten automatisiert generieren zu k nnen Dies kann erreicht werden indem das Dokument in einer Auszeichnungssprache vor liegt die sowohl eine strukturelle layoutorientierte und inhaltsbezogene Beschreibung desselben erlaubt 2 4 3 1 Dissertation Markup Language DiML Die Dissertation Markup Language DiML wurde im Rahmen des Projektes Dis sertationen Online an der Humboldt Universit t zu Berlin von Mitarbeitern des dor tigen Rechenzentrums entwickelt Hierbei handelt es sich um eine Document Type De 51 2 Aufgabenstellung Grundlagen Arbeitsabl ufe finition DTD auf der Basis von SGML XML speziell f r Doktorarbeiter JSMGO0 Da die wenigsten Autoren direkt in XML bzw SGM
109. Im Zeitraum zwischen Juni und November 2000 wurden die Ergebnisse der Be legarbeit von Mitarbeitern der SLUB ausgewertet und zus tzliche Anforderungen de finiert Im November 2000 erfolgte mit der Aush ndigung dieses Diplomthemas der Startschuss zur Weiterentwicklung des HSSS aufbauend auf den Ergebnissen der Be legarbeit der genaue Wortlaut des Diplomthemas ist im Abschnitt auf Seite zu finden Ziel der Diplomarbeit ist es nicht die endg ltige Produktiv Version eines Hochschulschriftenservers f r die SLUB zu erstelle sondern einen m glichst voll st ndigen Umfang der Dienste des HSSS in einer ersten Ausbaustufe prototypisch zu implementieren Das spezielle Augenmerk liegt dabei auf tieferen Architektur und Ar beitsablauferkenntnissen die erst durch eine solche prototypische Realisierung gewon nen werden k nnen und die f r die SLUB von universeller Natur sind unabh ngig davon wie sich die weitere Entwicklung des HSSS gestalten wird vor allem OPUS der Universit t Stuttgart 2was nach Auffassung des Autors auch gar nicht sinnvoll und m glich w re 23 1 Einf hrung 1 2 Inhalts berblick Zun chst wurde als Einf hrung und Motivation die Ausgangssituation beschrieben in der sich die meisten Universit tsbibliotheken im Bezug auf elektronische Dokumen tenverwaltung befinden Danach ist diese Situation f r die SLUB konkretisiert und damit speziell die Motivation f r Thema und Gegenstand der Diplomarbeit
110. Informationen f r den Metadatensatz hinzugef gt e Der Metadatensatz wird in die Tabelle der eingestellten tempor ren Metada tens tze geschrieben temp_metadatasets_finished siehe auch Abschnitt Cl im Anhang im betrachteten Beispiel also 994407959125 9687 pdf 16zumindest nicht mit den Mitteln der Admin Tools 160 5 2 Realisierung e Der Metadatensatz wird aus der Tabelle der aktuellen tempor ren Metadaten s tze gel scht temp_metadatasets siehe auch Abschnitt C im Anhang e Es erfolgt eine automatische Erstellung der Frontdoor unter Zuhilfenahme eines XSL Stylesheets welches aus der XML basierten Metadatensatzstruktur die vor gesehene XHTML Datei erstellt und in das vorher gebildete Webserver Verzeichnis einstellt in dem sich auch bereits das Dokument im Pr sentationsformat befin det Alle diese hier beschriebenen Aktionen werden entweder gemeinsam und korrekt ausgef hrt oder zur ckgesetzt Konnte die Transaktion erfolgreich abgeschlossen werden sind eine Reihe weiterer Aktionen erforderlich welche in der folgenden Auf z hlung aufgelistet sind e Die Abbildung der statischen URL s auf reale URL s die in Abschnitt 6 1 ab Sei te 178 n her beschrieben wird muss f r den aktuellen Metadatensatz aktualisiert werden e Der Index der verwendeten Volltextsuchmaschine die in Abschnitt ab Seite 185 n her erl utert wird muss f r den aktuellen Metadatensatz inkrementell aktualisiert werden e
111. Informationen ohne nderung des Quellcodes konfigurierbar sind Die eigentlichen Informationen zu den Hochschulschriften des Archivs befinden sich jedoch in Form von Metadatens tzen in der Datenbank Mit Hilfe der Klas se OAIMetadataRetriever k nnen diese Informationen dem OAIServlet zur Verf gung gestellt werden OAIMetadataRetriever benutzt wiederum den schon in Ab schnitt vorgestellten DBManager und erstellt als Ergebnis Objekte des Typs OAIMetadataSet welche einen Metadatensatz speziell f r die Zwecke des OAI Proto kolls kapseln Mit Hilfe der Klasse MetadataFormat welche ein OAI Metadatenformat beschreibtf Jund daf r Attribute wie metadataPrefix metadataScheme oder metadata Namespace besitzt kann die Klasse ODAIMetadataSet die vom OAI Protokoll geforderte XML Repr sentation von sich selbst durch die Methode createNode erstellen Die so entstehenden XML Strukturen werden dann vom OAI Servlet zu der ebenfalls XML basierten Gesamtstruktur komponiert welche innerhalb einer HTTP Antwort an den Aufrufer zur ckgesendet wird Die Klasse OAISet repr sentiert eine OAI Set Struktur welche im Rahmen des OAI Protokolls optional implementiert werden kann Ein Set fasst dabei eine be stimmte Menge von Records zu einer Struktur zusammen die es somit erlaubt alle Mitglieder dieser Struktur gemeinsam durch das Protokoll anzusprechen zu den Defi nitionen der einzelnen Protokollbegriffe siehe P 4 1 1 Die Art der Definition solcher Set St
112. Inhalt eines indizierten Feldes abh ngig von isTokenized 188 6 2 Objektorientierte Analyse und Design Der Mischungsfaktor ist als entscheidende Gr e den jeweiligen Verh ltnissen anzu passen Zur Optimierung werden die nur aus einem Dokument bestehenden Indizes im Hauptspeicher gehalten Durch diese Mischungsstrategie ist inkrementelles Indexieren performant m glich trotzdem wird die Segmentzahl bei gut gew hltem Mischungsfak tor relativ gering gehalten Abbildung 54 verdeutlicht den Algorithmus noch einmal beispielhaft Abbildung 54 Lucene Index Merge In diesem Fall wurde der Mischungsfaktor M 3 gesetzt und es haben schon 5 Mi schungen stattgefunden Die grau schattierten Indizes sind auf diese Weise bereits gel scht zusammengefasst worden Interessant ist dabei dass eine Kette von Zusam menfassungen entstehen kann So befanden sich nach dem Ablegen des neunten Doku mentenindexes M 3 Einzeldokumentenindizes auf dem Stapel sowie zwei Indizes mit drei Dokumenten Die drei Einzeldokumentenindizes wurden zun chst zu einem Index mit drei Dokumenten zusammengefasst und dieser wieder auf den Stapel geschoben Dadurch entstand die Situation dass sich M 3 Indizes mit jeweils drei Dokumenten auf dem Stapel befanden so dass diese ebenfalls zusammengefasst und als Index f r 9 Dokumente auf den Stapel zur ckgeschoben wurden Ist der Vorgang der Indexierung vorerst abgeschlossen kann von Lucene eine weite re Optimierung
113. L DDL Skripten zur Erzeugung eines ad quaten Datenbankmodels Datenbankschemas f r den entsprechenden Metadatensatz respektive die durch ihn beschriebene Dokumentenart 85 3 Systemarchitektur Schnittstelle eine beliebige Metadatensatz Spezifikation erstellen aus der transparent f r den Nutzer automatisch eine entsprechende XML Struktur erzeugt wird und an schlie end alle zur Realisierung notwendigen Teile der Anwendung ohne dass eine Zeile Quellcode programmiert werden m sste Die zweite Architekturvision lautet daher Architekturvision 2 Alle Informationen die einen Metadatensatz beschreiben sind von der Anwendung zu entkoppeln und in einer geeigneten XML basierten Struktur anzuordnen Mit Hilfe dieser Struktur sollen m glichst alle dynamischen Teile der Anwendung automatisiert zur Laufzeit erstellt und koordiniert werden Ziel dieser Architekturvision ist es die Anwendung so flexibel wie m glich zu hal ten insbesondere was die nderung und Erweiterung von Systemeigenschaften be trifft ohne manuell Quellcode ver ndern und kompilieren zu m ssen Diese Vision setzt voraus dass auch an anderen Stellen des Gesamtsystems Informationen so weit wie m glich entkoppelt und damit konfigurierbar gehalten werden Die dritte Architekturvision betrifft auch den dritten Teil der Gesamtanwendung der die Suche und die Navigation ber den persistent eingestellten Metadatens tzen erm glichen soll Diese webbasierte Anwe
114. L schreiben sondern stattdes sen Standardtextverarbeitungssysteme wie z Bsp MS Word oder Textsatz orientierte Software wie Latex oder PDF Tex nutzen m ssen f r diese Applikationen Formatvorla gen und Plugins existieren die eine Umwandlung des jeweiligen Formats in das DiML konforme Zielformat erlauben Solche Formatvorlagen und Plugins wurden ebenfalls vom Rechenzentrum der Humboldt Universit t zu Berlin entwickelt bzw getestet und angepasst Am Beispiel einer in Word geschriebenen Dissertation l sst sich der gesamte Ar beitsablauf gut beschreiben Hat sich der Doktorand entschieden seine Dissertation so zu verfassen dass sie sp ter in das DiML Format berf hrt werden kann ben tigt er als erstes eine Formatvorlage f r sein Textverarbeitungssystem in diesem Fall MS Word Diese Formatvorlage ist notwendig um dem originalen Dokumentenfor mat gewisse Formatanweisungen hinzuzuf gen aus denen sp ter die entsprechenden DiML Informationen gewonnen werden 2 Unter Zuhilfenahme dieser Formatvorla ge erstellt der Autor nun seine Dissertation und l sst sie am Ende in elektronischer Form der entsprechenden Institution z Bsp Rechenzentrum zukommen Hier er folgt der eigentliche Konvertierungsvorgang Dazu wird das Dokument als erstes auf die korrekte Nutzung der Formatvorlage berpr ft und anschlie end eine zus tzli che Formatvorlage Druckformatvorlage geladen Danach wird das Dokument mit Hilfe des Konverters Microsoft S
115. M glichkeiten nutzen zu k nnen klickt ein Nutzer in der oberen Navigationsleiste den Button Administration Dadurch wird unter anderem die obe re Navigationsleiste ausgewechselt und mit neuen sich auf Administrationsfunktiona lit ten beziehenden Buttons best ckt Abbildung 47 zeigt diese Navigationsleiste gleichzeitig wurde hier bereits die Aktion Benutzerverwaltung gew hlt welche die Anwendung zur dynamischen Erzeugung des auf der folgenden Seite abgebildeten For mulars veranlasst 18Damit sind die eigentlichen Persistenz Tabellen pers_ innerhalb der Datenbank gemeint siehe auch Abschnitt Clim Anhang Bei der Tabelle temp_metadatsets_finished handelt es sich qua si um eine vorgelagerte Stellvertreter Tabelle f r die AdminTools welche dieser Teilanwendung eine f r sie optimierte Sicht und einen direkteren Zugriff auf die entsprechenden Metadatenstruk turen bietet 19mit Ausnahme der E Mail Benachrichtigung des Autors 162 5 2 Realisierung Abbildung 47 HSSS AdminTools Benutzerverwaltung Wie zu erkennen ist bestehen die m glichen Administrationsaktionen durch das Klicken der Buttons Benutzerverwaltung Konfiguration Stylesheets Logda teien SQL bzw ToolBox wobei in der Abbildung bereits die Aktion Benutzer verwaltung gew hlt wurde Der Button Hauptseite f hrt den Nutzer wieder auf die schon bekannte in Abbildung 4
116. ServletCo LuceneManager config ServletCo LuceneManager indexdir String m run void Indavinnal hanlaan int Comparable Hit originaltitle String date String Hit Hit number int score int identifier St setDate d Date void setDate s String void getDate String compareTo o Object int Comparable HsssHitCollector DEFAULT_COUNT int 10 DEFAULT_START int 0 start int 0 count int 0 HsssHitCollector h Hits HsssHitCollector h Hits b boolean setStart s int void setStart s String void getStart int FieldSearchString TimeHit searchstring String hit Hit null FieldSearchString searchstring Stri TimeHit h Hit time long compareTo o Object int tokenStream reader Reader Tokenq Abbildung 55 HSSS Package lucene Zentraler Zugriffspunkt auf die Volltextsuchmaschine fiir die Anwendung ist die Klasse LuceneManager die auch innerhalb eines separaten Threads ablaufen kan Diese Klasse stellt Methoden f r alle notwendigen Interaktionen bereit zum Bei spiel newIndex addDocToIndex search oder searchFields u a Von den Suchmethoden wie search wird ein HsssHitCollector Object zur ckgegeben das die Suchergebnisse enth lt und einige weitergehende Funktionalit ten unterst tzt die im Anschluss erl utert werden Ein einzelner Treffer wird durch die Klasse Hit gekapselt TimeHit enth lt die Klasse Hit und ver ndert deren Verhalten und definiert insbesondere eine ander
117. Wurzeln hat die Initiative vor allem im wissenschaftlichen Bereich wo sie den Zugriff auf e Print Archive verbessern und erweitern m chte um somit die gesamte wissen schaftliche Kommunikation zu bereichern Die Mechanismen allerdings auf denen die von der OAI entwickelten Spezifikationen basieren sind sowohl von der Umgebung als auch vom Inhalt der auszutauschenden Daten unabh ngig Die OAI ist eine in den USA anerkannte Organisation der zwei namhafte Pro fessoren der Cornell University vorstehen Sie besteht aus einem organisatorischen und einem technischen Komitee Unterst tzt wird die OAI von der Digital Library Federation und der Coalition for Networked Information sowie einer Reihe weiterer Organisationen und Universit ten in den USA Hauptentwicklung der OAI ist das Open Archives Metadata Harvesting Protocol welches ein generisches Interaktions Framework f r den verteilten Zugriff auf digitale Inhalte darstellt Dieses Protokoll wurde mit Absicht sehr einfach gestaltet um die Barriere einer Teilnahme bzw einer Implementation m glichst gering zu halten Dieses Framework kann jede Instituti on nutzen um ber das OAI Protokoll an einem Peer to Peer Verbund mit anderen Institutionen teilzunehmen es m ssen vorher lediglich die daf r notwendigen tech nischen Voraussetzungen geschaffen werden Die Teilnahme kann zwei verschiedene 10insbesondere auch von der konomischen Umgebung 38 2 4 Digitale Archive und elekt
118. a Vectorgrafikformate von den Browsern zur Zeit leider noch nicht ausreichend 26F r die Skalierung von Schriftgr en wurde allerdings im Gegensatz zur normalen Skalierung ein anderer nichtlinearer Faktor gew hlt degressives Wachstum 198 6 3 Realisierung bzw gar nicht unterst tzt werden und die Skalierung von Bitmap Grafiken durch den Browser qualitativ nicht befriedigt So musste ein Ausweg gefunden werden der dar in bestand die Grafiken mit einem Grafikbearbeitungsprogramm f r die gew nschten Aufl sungen explizit zu skalieren und unter verschiedenen Namen zu speichern die dann von der Skalierungsfunktion berechnet werden so dass f r jede Aufl sung immer die richtigen Grafiken eingebunden werden Dies bedeutete zum einen nat rlich einen relativ gro en Aufwand da jede Grafik vorher f r vier Aufl sungen skaliert werden musste und zum anderen den Verlust der M glichkeit bergangslos zu skalieren Zu s tzlich bedeuten die redundanten explizit skalierten Bilder einen Performanceverlust beim Nachladen einer neuen Aufl sung Trotzdem konnte die dritte Architekturvi sion bis auf die genannten M ngel zufriedenstellend prototypisch realisiert werden so dass eine optimale Platznutzung in den vier vorgegebenen Skalierungen m glich ist Daneben wurde ein zus tzliches Konzept realisiert welches erlaubt einzelne Teile der Schnittstelle auch in einem anderen Zusammenhang zu nutzen bzw gesondert darzustellen F r
119. abgeleitet worden Es folgte ein kurzer Abriss der Bem hungen die zu diesem Thema von Seiten der SLUB bereits unternommen worden sind Im sich anschlie enden Kapitel wird die Aufgabenstellung dieser Diplomarbeit vor gestellt und kurz interpretiert Danach folgt ein R ckblick auf die Belegarbeit die der Diplomarbeit inhaltlich vorausging Es werden Anforderungen und Ergebnisse der Be legarbeit erl utert St rken und Schw chen analysiert und damit auch Konsequenzen f r die Diplomarbeit gezogen Anschlie end wird noch einmal auf die Situation der Universit tsbibliotheken und deren Umfeld eingegangen insbesondere auf technische Schwierigkeiten und Probleme aber auch auf interessante M glichkeiten neue Proto kolle Schnittstellen und Initiativen Anhand von drei Initiativen bzw Organisationen die etwas detaillierter und durchaus auch kritisch betrachtet werden soll die Entwick lung auf diesem Gebiet in den letzten Jahren nachvollzogen und eingesch tzt sowie Ankn pfungspunkte f r die eigene Entwicklung aufgezeigt werden Anschlie end soll die Architektur des eigenen Systems vorgestellt werden begin nend mit der Analyse und Spezifikation der Arbeitsabl ufe bzw Gesch ftsg nge die organisatorisch zu etablieren und von System weitestgehend zu unterst tzen sind Da nach werden zun chst Architekturvisionen beschrieben die sich auf das System in seiner Gesamtheit beziehen und eine Vorstellung davon liefern sollen welche Schwer
120. actory Method TemporalStorageFactory factory TemporalStorageFactory TemporalStorageFactory createTemporalStorage wird anhand der ServletConfig entschieden ob dateibasierte oder db basierte Klasse initialisiert wird init config ServletConfig void getDescription String storeMetadataSet ms MetadataSet t deleteMetadataSet ms MetadataSet storeMetadataSets ss SortedSet tra Gr SybaseDBTemporalStorage config ServletConfig null hd HsssData null init config ServletConfig void storeMetadataSet ms MetadataSj deleteMetadataSet ms Metadata storeMetadataSets ss SortedSet loadMetadataSets kindofdocume finishMetadataSet ms MetadataS resetMetadataSet ms MetadataS loadMetadataSet id String kindof hsssData HsssData description String setHsssData hd HsssData void loadMetadataSets kindofdocument finishMetadataSet ms MetadataSet resetMetadataSet ms MetadataSet fi loadMetadataSet id String kindofdoc config ServletConfig null hd HsssData null init config ServletConfig void storeMetadataSet ms MetadataS deleteMetadataSet ms Metadata storeMetadataSets ss SortedSet loadMetadataSets kindofdocume finishMetadataSet ms MetadataS resetMetadataSet ms MetadataS loadMetadataSet id String kindofg description String hsssData HsssData Abbildung 27 HSSS Package temporalpersistence Ausschnitt Der Vorteil liegt in der Entkopplung und in dem Verstecken von
121. adox of Digital Preservation Computer March 2001 James W Cooper Java Design Patterns Addison Wesley 2000 James Duncan Davidson and Danny Coward Java Servlet Specification Version 2 2 Sun Microsystems Dec 1999 Stefan Denninger und Ingo Peters Enterprise JavaBeans Addison Wesley 2000 DINI Arbeitsgruppe Elektronisches Publizieren Empfehlungen zum Umgang mit elektronischen Hochschulpublikationen innerhalb von Univer sit ten Bibliotheken und Verb nden Deutsche Initiative f r Netzwerk informationen DINI Stand Mai 2001 286 Literaturverzeichnis DINa01 Fla97 GHJ96 Gra98 Gro00 GuS00 GVC00 Ham97 Har00 HCF98 HeS00 Hol00 HuC98 JMSO1 LaL99 DINI Arbeitsgruppe Elektronisches Publizieren Dr Bruno Klotz Berendes Empfehlung zu OAI Setdefinitionen Deutsche Initiative f r Netzwerkinformationen DINI 18 Juni 2001 DRAFT Status David Flanagan JavaScript O Reilly 1997 Erich Gamma Richard Helm Ralph Johnson John Vlissides Entwurfs muster Addison Wesley 1996 Mark Grand Patterns in Java a catalog of reusable design patterns Wiley 1998 Andreas Grote Verfl chtigt Der Zahn der Zeit nagt an den digitalen Daten ct HEISE 24 2000 Gunter Saake Kai Uwe Sattler Datenbanken und Java dpunkt 2000 Markus Gumbel Marcus Vetter Carlos C rdenas Java Standard Librar
122. al science law economics computer science electrical engineering and information technology mechanical engineering civil engineering El E Fertig e Intemet Abbildung 65 OAI Informationsseite des HSSS 217 7 Implementierung des OAI Protokolls 7 3 Einsch tzung Im Rahmen der Diplomarbeit konnte das OAI Protokoll der Version 1 1 vollst ndig implementiert werden Zus tzlich wurden sogar optionale Anforderungen wie etwa die Unterst tzung von Sets und Resumption Token realisiert Durch die XML basierte Konfigurationsstruktur oaisets xml bzw die Konfigurationsdatei web xml lassen sich zudem viele Parameter der Protokoll Implementation von au en steuern Da alle An forderungen des Protokolls realisiert wurden und die Implementation zus tzlich fast alle der optionalen Rubustness Tests L OAd meistern sollte steht einer Registrie rung des Repository bei der OAI als Data Provider nichts im Weg Damit kommt der HSSS der wichtigen Anforderung nach ein offenes interoperables Archiv zu sein welches in einem dezentralen Verbund bergreifend national und international genutzt werden kann 218 8 Zusammenfassung und Ausblick Inhalt des Kapitels 8 1 Zusammenfassung 1 soc ee ee ee ee es 220 BERNER EIER ee cae NE 222 air 222 va 224 EE 225 B24 Vorbossorungsm glichkeiten f r die Access Tool my 1858 226 8 3 Ausblick uo 3 Bb ee 80 8 I 88 2 a8 DEE N 227 219 8 Zusammenf
123. all ist es numeric 6 also eine 6 stellige Zahl Die Eindeutigkeit wird durch das Inkrementieren dieses Attributs erreicht weshalb auch die Bezeichnung auto increment f r Attribute dieses Typs gebr uchlich ist 168 5 3 Persistenzrealisierung bereits erl uterten Prim rschl ssel id besteht Als letzte hier betrachtete Struktur existiert innerhalb des Datenbankschemas die in Abbildung 51 gezeigte MetadataSet N 1 Relation Entity Entity z Abbildung 51 Grundlegende Schemastruktur 3 Bei dieser Struktur handelt es sich um eine indirekte N M Beziehung zwischen Metadatens tzen und anderen Entit ten welche durch ein weiteres Attribut der Be ziehungstabelle n her bestimmt wird Die im folgenden abgebildeten Relationen sollen die Struktur am Beispiel von Schlagworten bzw Klassifikationen im Zusammenhang mit Metadatens tzen konkretisieren pers_subject id subject pers_subject_metadataset id type subject_id metadataset_id In der Relation pers_subject werden im Attribut subject alle Schlagworte und Klassifikationen f r Hochschulschriften gespeichert Da das Attribut als Schl ssel kandidat definiert ist k nnen keine Dopplungen auftreten Die Beziehungsrelation pers_subject_metadataset ordnet Metadatens tzen Schlagworte bzw Klassifikatio nen zu Dabei bestimmt das Attribut type den Typ dieser Zuordnung und damit auch den Typ des Schlagwortes bzw der Klassifikation M gliche Typen sind eige
124. als neu So gibt es schon seit geraumer Zeit sogenannte Harvesting Protocols f r digitale Dokumente der Fachrichtungen Physik und Mathematik Au erdem gibt es seit langer Zeit komplexe Protokolle wie etwa Z39 50 das insbesondere im Bibliothekswesen eingesetzt wird Diese vorhandenen M glichkeiten haben leider je weils spezifische Schw chen die eine ausreichende Verbreitung bisher verhinderten So beziehen sich die oben angesprochenen Harvesting Architekturen auf bestimmte wis senschaftliche Disziplinen sind also eher Graswurzel Initiativen und nicht generisch genug um bergreifend genutzt werden zu k nnen Das Protokoll 239 50 hingegen ist viel zu komplex und ebenfalls zu spezifisch um eine gr ere Verbreitung zu finden Im folgenden Abschnitt sollen kurz einige technische Details des Open Archives Metadata Harvesting Protocol in der Version 1 0 n her erl utert werden wobei speziell die Frage von Interesse ist wie die angesprochenen Schw chen der vorhandenen L sungsans tze vermieden werden sollen 11 _ MathNet http www math net de PhysNet http www physik uni oldenburg de EPS PhysNet 39 2 Aufgabenstellung Grundlagen Arbeitsabl ufe 2 4 1 1 Protocol for Metadata Harvesting Das Hauptziel des Open Archive Protocol for Metadata Harvesting im Folgenden als OAI Protokoll bezeichnet L OAc ist die Realisierung eines anwendungsunabh ngigen Interaktions Frameworks welches von den verschiedensten
125. ame gt Forschungsbereichte Proceedings etc lt setName gt 13 lt set gt 14 lt set gt 5 lt set gt 16 lt setSpec gt dnb lt setSpec gt 17 lt setName gt DNB Sachgruppe lt setName gt 8 lt set gt 9 lt setSpec gt 1 lt setSpec gt 20 lt setName gt Wissenschaft und Kultur allgemein lt setName gt 21 lt set gt 22 lt set gt 23 u 24 lt set gt 25 SS 26 lt set gt 27 lt oaisets gt Listing A2 XML Struktur der OAI Sets 257 C Datenbank Schema des HSSS Inhalt des Kapitels Ot berblick 2 u a dsc a a Sem a REE A C 2 Schemial gt 4 68 2 I 3 2 ALES a a ae 259 C Datenbank Schema des HSSS C 1 berblick Auf den folgenden Seiten soll das Datenbank Schema des HSSS vollst ndig vorgestellt werden Dazu werden als erstes alle beteiligten Tabellen mit ihrer jeweiligen Funktion aufgelistet in den beiden folgenden Tabellen auf den n chsten Seiten Danach erfolgt eine bersicht ber die erstellten gespeicherten Prozeduren innerhalb der Datenbank Im anschlie enden Abschnitt werden die Tabellen der HSSS Datenbank jeweils einzeln aufgef hrt und n her erl utert Dabei werden die folgenden Attribute zur Beschreibung verwendet e Name Name der jeweiligen Spalte e Datentyp Datentyp der jeweiligen Spalte el Steht f r Identify Identify sorgt f r eine eindeutige Identifikationsnummer jedes Tupels in der Tabelle bei anderen Datenbanken als Auto Increment
126. an e Produktname PoolMan e Version 1 4 e Homepage http www codestudio com e Beschreibung PoolMan verbessert das Verhalten von datenbankbasierten Webanwendungen indem es das Pooling und das Caching von Datenbankverbindungen erm glicht e Einsatzbereich innerhalb des Gesamtsystems PoolMan wird bei fast allen Datenbankzugriffen verwendet ist aber in der Kon figurationsdatei web xml aktivierbar deaktivierbar Au erdem k nnen Interna von PoolMan durch eine separate Konfigurationsdatei beeinflusst werden D 2 10 PJ e Produktname Etymon PJ 281 D Verwendete Technologien Produkte e Version 1 1 Homepage http www etymon com pj index html Beschreibung PJ ist ein Entwicklungswerkzeug fiir das Parsen Modifizieren und Erstellen von PDF Dokumenten Es ist dabei in der Lage eine Objekt Repr sentation eines vorhandenen PDF Dokumentes im Hauptspeicher zu erstellen Einsatzbereich innerhalb des Gesamtsystems PJ wird verwendet um den Volltext aus PDF Dokumenten zu extrahieren und an das PDF Dokument eine Seite mit einem Zeitstempel des HSSS anzuh ngen D 2 11 FINJ Produktname FINJ Version 1 0 1 Homepage http finj sourceforge net Beschreibung FINJ ist ein javabasiertes FTP API und steht f r FTP in Java Es erlaubt den Zugriff auf FTP Server nach RFC 959 Einsatzbereich innerhalb des Gesamtsystems FINJ wird innerhalb der Admin Tools genutzt um den FTP basierten Metada t
127. andere Hashtabelle hinzuf gt und dabei nur ge nderte oder neue Schl ssel ber cksichtigt Im Ergebnis bleibt das alte Objekt und damit auch die Referenz erhalten so dass diese Aktualisierung beliebig oft wiederholt werden kann 182 6 1 Realisierung einer absoluten URL Der h chste id Wert wird vom UrlMapper ben tigt um den Zugriff auf die per sitenten URL s innerhalb der Tabelle pers_metadatset optimieren zu k nnen Diese Optimierung ist deshalb m glich weil das id Attribut durch ein automatisches Inkre mentieren gebildet wird und nderungen an Metadatens tzen so realisiert sind dass der alte Metadatensatz mit Prim rschl ssel id gel scht wird und daf r ein neuer Me tadatensatz mit neuem Prim rschl ssel erstellt wird Dadurch haben Anderungen der Abbildungsmenge durch neue Metadatens tze oder nderungen an schon vorhan denen immer zur Folge dass sich der Prim rschl sselwert erh ht Deshalb ben tigt der UrlMapper um die Abbildungsmenge zu aktualisieren nunmehr nur die Tupel die einem Prim rschl ssel zugeh rig sind der gr er als der zuletzt zur ckgegebene id Wert ist Dies f hrt zu einer wesentlich effizienteren Suche in der Datenbank und einer deutlich kleineren Ergebnismenge und damit zu einer schnelleren bertragung Die Aktualisierungsanfragen unternimmt das UrlMapper Objekt in einem bestimm ten Intervall welches von au en durch einen entsprechenden Konfigurationsparameter in der web xml
128. anwendung myHSSS gewonnen werden konnten auf den MetadatenGenerator bertragen werden e Die kontextsensitive Hilfe des MetadatenGenerators k nnte dahingehend verbes sert werden dass die Beschreibungen und Beispiele zu den einzelnen Subelemen ten die bisher als JSP Komponenten realisiert sind in die Datenbank ausgela gert werden Gleichzeitig w re die Entwicklung einer Anwendung sinnvoll die es erlaubt diese ausgelagerten Informationen zu bearbeiten 8 2 3 Verbesserungsm glichkeiten f r die Admin Tools Die Mehrheit der hier aufgef hrten Verbesserungen bzw Erweiterungen wurde bereits in Abschnitt auf Seite diskutiert der Vollst ndigkeit halber sollen sie hier trotzdem noch einmal aufgef hrt werden e Die bereits vorhandenen administrativen M glichkeiten der Teilanwendung Ad min Tools sollten erweitert und stabilisiert werden Es k nnten au erdem wei tere Funktionalit ten integriert werden die im Rahmen der Diplomarbeit noch nicht in Angriff genommen oder nur angedeutet werden konnten Beispielsweise ist bereits die Oberfl che eines webbasierten interaktiven SQL Clients erstellt worden es fehlt aber noch dessen Anbindung an die Datenbank Weitere denk bare Funktionalit ten w ren die Integration eines Upload Mechanismus f r die Hochschulschriften in das tempor re Dokumentenverzeichnis des HSSS und ei ne webbasierte E Mail Schnittstelle zu dem E Mail Account des HSSS zur Zeit hsss slub dresden de Dadurch w ren da
129. assung und Ausblick 8 1 Zusammenfassung Die im Rahmen des Diploms erreichten Ergebnisse k nnen sich durchaus sehen lassen und sollen in diesem Abschnitt chronologisch erl utert und zusammengefasst werden Dabei ergeben sich m glicherweise Ansatzpunkte f r Verbesserungen und Weiterent wicklungen die dann im folgenden Abschnitt wieder aufgegriffen werden Zun chst besch ftigte sich die Diplomarbeit relativ ausf hrlich mit dem bibliothe karischen Umfeld insbesondere in den Bereichen digitale Archivierung elektronisches Publizieren und Dokumentenmanagement Dabei konnten wichtige Erkenntisse f r die sp tere Entwicklung des HSSS gewonnen werden Leider musste hier aber auch die Feststellung getroffen werden dass die bestehenden Informationen und Hilfsangebote nicht optimal sind und insbesondere keine bergeordnete Koordination von Ressour cen Initiativen und Projekten erkennbar wird so dass der Laie schnell die bersicht verliert und auch generell gefragt werden muss ob die gegenw rtige Situation der Ent wicklung von modernen interaktiven und interoperablen wissenschaftlichen Archiven zutr glich ist Mit diesen Erkenntnissen wurde begonnen die Gesamtarchitektur eines modernen wissenschaflichen Dokumentenservers bzw Hochschulschriftenservers zu entwickeln Die Anspr che dieser Architektur und insbesondere der aus ihr abgeleiteten Archi tekturvisionen gehen ber die M glichkeiten einer Diplomarbeit hinaus und sollten des
130. ator gemeint Hier sind Parameter wie JavaScript Validierung E Mail Benachrichtigung und verschiedene Layouts der Webanwendung einstellbar Diese Klasse ist im Zusammenhang mit der Klasse MetadataGenerator JSPCommunicatorImp nach dem Entwurfsmuster Bridge zu betrachten 123 4 Teilanwendung 1 MetadatenGenerator Contoller Session Session initialisieren 7 Dokumentenart w lllen N 8 Parameter mit Dokupfentenart Objektstruktur f Dokumentenart init 10 JSPCommunicator setzen j In 15 Metadaten validieren hinzuf gen n 16 JSPCom aktualisieren setzen n 17 ad quates JSP setzen n 18 Formular pr sentieren mit Hilfe d Inform aus JSPCommupic f 19 Eingaben abschlid en 20 Metadatensatz komplett 21 Metadatensatz temp speichern 2 Session invalidieren 23 Bestatigung prasentiern 24 Bestatigungs E Mail schicken falls eingestellt Abbildung 32 View Controller Aktivit ten des MetadatenGenerators Am Anfang beginnt der Autor die Aktionsfolge indem er den MetadatenGene rator startet 1 Seine Anfrage wird automatisch an den Controller weitergeleitet 124 4 1 Objektorientierte Analyse und Design 2 welcher erkennt dass es sich um einen initialen Zugriff handelt Der Con troller initialisiert daher ein Session Objekt 3 und f gt diesem ein Objekt vom Typ Me
131. atorConfiguration layouts Map null JSPCommunicatorlmp defaultLayout String css metadata css MetadataGeneratorJSPCommunicatorimp MetadataGeneratorConfiguration config Servietq electedDocumentType DocumentType null ms MetadataSet null bi Browserlnformation null BrowserInformation MetadataGeneratorBrowserinformation currentJSPFile String configuration Configuration JSPCommunicator browserInformation BrowserInformation MetadataGeneratorJSPCommunicator hsssData HsssData MetadataGeneratorBrowserinformation supportedLanguagesilterator init req HttpServletRequest void supportedFormats lterator MetadataGeneratorJSPCommunicator config Sel init m Map vold supportedDocumentTypesilterator Abbildung 31 HSSS Package metadatagenerator ffentlicher Zugriffspunkt auf die Webanwendung MetadatenGenerator ist die Klas se bzw das Servlet MetadataGeneratorServlet welche von HttpServlet erbt Wie in Abschnitt 3 3 1 2 bereits kurz angedeutet erh lt das Servlet vom Servlet Container Zugriff auf eine Reihe von Informationen ber ServletConfig die zuvor in der Kon figurationsdatei web xml spezifiziert werden k nnen Aufgabe der Servlet Klasse ist es HTTP Anfragen entgegenzunehmen zu bearbeiten bzw zu delegieren und entspre chende Antworten zur ckzugeben Dabei bedient sich die Servlet Klasse der Methoden 122 4 1 Objektorientierte Analyse und Design doGet f r HTTP GET Requests bzw doPost f
132. atz 14 Tabellenverzeichnis gt S5 Metadatensatz Datum Tabelle A45 HSSS Metadatensatz Bearbeitungsnummer Tabelle A46 HSSS Metadatensatz Gesamt Bearbeitungsstatus Tabelle A47 HSSS Metadatensatz Dokument Bearbeitungsstatus Tabelle A48 HSSS Metadatensatz Metadaten Bearbeitungsstatus Tabelle A49 HSSS Metadatensatz Exportinformation DDB Tabelle A50 HSSS Metadatensatz Exportinformation SWB Tabelle A51 HSSS Metadatensatz Dokumentinformationen Tabelle A52 HSSS Metadatensatz E Mail Adresse des Autors Tabelle A53 HSSS Metadatensatz Telefonnummer des Autors Tabelle A54 HSSS Metadatensatz Nachricht des Autors Tabelle A55 Bedeutung der Relationen Prefixe 2 2 2 2 2 2 Tabelle A56 Tabellen bersicht Teil 1 Tabelle A57 Tabellen bersicht Teil 2 Tabelle A58 bersicht der gespeicherten Prozeduren Teil 1 Tabelle A59 bersicht der gespeicherten Prozeduren Teil 21 Tabelle A60 die Tabelle config_hsss Tabelle A61 die Tabelle config_metadatasets Tabelle A62 die Tabelle stat_metadatasets Tabelle A63 die Tabelle temp_metadatasets Tabelle A64 die Tabelle stat_metadatasets_finished Tabelle A65 die Tabelle pers_address Tabelle A66 die Tabelle pers_date Tabelle A67 die Tabel
133. atzbe schreibung f r die Dokumentenart Disserta tion MetadataSetBericht xml Enth lt die XML basierte Metadatensatzbe schreibung f r die Dokumentenart Bericht oaisets xml Enth lt die von der OAI Implementierung des HSSS unterst tzten Set Strukturen in XML basierter Form hsssdb props Enth lt Konfigurationsdaten f r das DBMS nicht XML basiert Tabelle 4 Konfigurationsstrukturen des HSSS 36Es ist absichtlich nicht von Konfigurationsdateien die Rede weil die entsprechenden XML Strukturen nicht notwendigerweise in Dateiform vorliegen m ssen sondern sich zum Beispiel auch in einer Datenbank befinden k nnen 37 Weitergehende Informationen finden sich in Abschnitt Blim Anhang ab Seite bzw in JMS01 95 3 Systemarchitektur Die einzelnen Teilstrukturen werden an geeigneten Stellen z Bsp in den Kapiteln zu den Teilanwendungen im weiteren Verlauf der Diplomarbeit vertieft au erdem finden sich Informationen ber die jeweiligen Inhalte im Anhang Kapitel B ab Seite sowie eine detaillierte Beschreibung aller Parameter in JMS01 3 3 2 Architekturdetails auf Server Ebene Dieser Abschnitt der sich mit einigen Architekturdetails auf der Server Ebene der Gesamtanwendung besch ftigen soll wird zun chst kurz die Infrastruktur bzw die Technologieplattform vorstellen die als Grundlage f r die Server seitigen Teile der Anwendung dient und im Anschlu auf m gliche Alternativen eingehen Da di
134. aussetzungen f r die Nutzung dieser Anwendung auf der Client Seite nicht erf llen k nnen Diese wesentli chen clientseitigen Voraussetzungen an den Browser sind e Unterst tzung von JavaScript mindestens Version 1 2 e Unterst tzung weiter Teile von CSS Cascading Stylesheets Version 1 0 e Unterst tzung weiter Teile von HTML 4 0 Diese Anforderungen werden im allgemeinen von allen weitverbreiteten Browsern ab der Version 4 0 unterst tzt womit zur Zeit etwa 95 aller verwendeten Browser abgedeckt ist so dass in etwa auch dieselbe Prozentzahl potentieller Nutzer durch die Anwendung unterst tzt werden kann Die restlichen f nf Prozent der Nutzer unterteilen sich in Nutzer e die zwar einen modernen Browser benutzen jedoch aus Sicherheitsgr nden Tech nologien wie JavaScript nicht verwenden deaktiviert haben e die immer noch sehr alte Browser verwenden im Extremfall zeichenorientierte Browser wie etwa Lynx Um auch diese Gruppe nicht von einer Nutzung auszuschlie en bedarf es einer al ternativen Teilanwendung die zwar m glichst eine ann hernde Funktionalit t wie der MetadatenGenerator bietet dabei allerdings nur minimale Anspr che an die F hig keiten der Clients Browser stellt Eine solche Version wurde in Zusammenarbeit mit den bereits erw hnten Auszubildenden der Abteilung Datenverarbeitung der SLUB 139 4 Teilanwendung 1 MetadatenGenerator unter dem Namen MetadatenGenerator Light erfolgreich
135. ben alle T tigkeiten in diesem Bereich national zu koordinieren Sie erarbeitet klare Mindestanforderungen die notwendig sind um als wissenschaftliches Archiv zertifiziert werden zu k nnen Nur Archive die dieses Zertifikat besitzen oder es durch Weiterentwicklungen ausdr cklich erlan gen wollen werden gef rdert Neben diesen nationalen Aufgaben beobachtet die Organisation die internationale Entwicklung und nimmt an entsprechenden Veranstaltungen teil wobei der gro e Vorteil besteht dass sie Deutschland als Ganzes vertreten kann Neben technischen Fragen geh ren hier vor allem auch juristische und konzeptionelle Fragen zu den Aufgabengebieten dieser Organisa tion Andere regionale Organisationen haben nach wie vor ihre Berechtigung allerdings sind einzig und allein die Richtlinien der nationalen Organisation f r alle wissenschaftlichen Archive bindend 56 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld e Zu den wichtigsten Aufgaben der Organisation geh rt es den Aufbau von dezen tralen aber zueinander kompatiblen langfristig verf gbaren Archiven zu koordi nieren Dazu ist es zwingend erforderlich eine Reihe von Mindestanforderungen zu spezifizieren die von allen Archiven unbedingt zu realisieren sind Bei heuti gem Stand der Technik w rden folgende Anforderungen dazu z hlen Das OAI Protokoll ist vom Archiv zu implementieren d h jedes Archiv ist in der Lage als Data P
136. bgeschlossen werden wird der Metadaten satz von der Anwendung in seine XML basierte Repr sentation umgewandelt und anschlie end tempor r gespeichert Die Session des Autors wird vom System beendet und es wird ihm eine Webseite pr sentiert welche die bernahme der tempor ren Metadaten in das Gesamtsystem best tigt Gleichzeitig verschickt die Anwendung eine E Mail an eine in den Konfigurationsstrukturen einstellbare Addressd um die Vollstaindigkeit bedeutet in diesem Zusammenhang alle prim ren obligatorischen Metadaten sind vorhanden und konnten korrekt validiert werden alle prim ren optionalen Metadaten die bermittelt wurden konnten auch korrekt validiert werden 12 ur Zeit hsss slub dresden de 132 4 2 Realisierung SLUB Mitarbeiter des Referats 5 3 vom Eingang eines neuen Metadatensatzes zu in formieren Hat der Autor die Voreinstellung dass er eine E Mail Benachrichtigung erh lt nicht deaktiviert und gleichzeitig im letzten Formular seine E Mail Addresse bekanntgegeben erh lt er ebenfalls eine Best tigungsnachricht in der er auf weitere M glichkeiten im Umgang mit dem Gesamtsystem hingewiesen wird siehe dazu auch Abschnitt 4 4 2 Der Metadatensatz ist nun auch in der Teilanwendung Admin Tools verf gbar welche im Kapitel 5 ab Seite 145 beschrieben wird 133 4 Teilanwendung 1 MetadatenGenerator 4 3 Persistenzrealisierung Bei der Realisierung der tempor ren Persistenz von Meta
137. ch sagen dass die entstandenen Versionen von myHSSS und AccessTools durchaus dazu geeignet sind vorl ufig den Zugriff auf alle Hochschulschriften des Gesamtsystems in Form von Suche bzw Navigation sicher zustellen allerdings sollten gerade sie kontinuierlich weiterentwickelt und verbessert wobei auch Testsuchen in ca 40 Volltexten mit durchschnittlich 200 KByte Text nach einem Stopwortlisten Wort wie so ausgezeichnete Antwortzeiten lieferten 205 6 Teilanwendung 3 HSSS AccessTools myHSSS werden Eine Reihe n tzlicher Hinweise auf solche Erweiterungen und Verbesserungen soll der letzte Teil dieses Kapitels liefern diese Verbesserungen werden in Abschnitt ab Seite noch einmal strukturiert zusammengefasst e Der gegenw rtig verwendete Abbildungsansatz der expliziten Abbildung ist aus den in Abschnitt genannten Gr nden zu berdenken und gegebenenfalls durch den Ansatz einer impliziten Abbildung mit Hilfe einer Abbildungsfunk tion zu ersetzen Dabei sollten Testmessungen belegen ob ein solcher Wechsel wirklich sinnvoll und notwendig ist Bei einer Umstellung ist darauf zu achten dass bereits ver ffentlichte absolute URL s weiterhin korrekt abgebildet werden m ssen so dass wahrscheinlich zwei verschiedene Abbildungen unterst tzt wer den m ssen e Die gegenw rtig genutzte Stopwortliste realisiert innerhalb der Klasse HsssStop Analyzer ist zu berpr fen und zu vervollst ndigen Au erdem w re die Im
138. che Publizieren an Hochschulen im Fol genden nur noch als Arbeitsgruppe Elektronisches Publizieren bezeichnet L DIb 2 4 2 1 Ziele der Arbeitsgruppe Elektronisches Publizieren Ziel der Arbeitsgruppe Elektronisches Publizieren und des von ihr herausgegebenen Dokuments Empfehlungen zum Umgang mit elektronischen Hochschulpublikationen innerhalb von Universit ten Bibliotheken und Verb nden im Folgenden als Emp fehlungen bezeichnet sind Empfehlungen zum Umgang mit elektronischen Hochschulschriften Dabei sollen zu diesem Thema sowohl der gegenw rtige Stand in Deutschland aber auch die internationalen Entwicklungen reflektiert werder wo bei es der Arbeitsgruppe darum geht eine Kultur des elektronischen Publizierens an wissenschaftlichen Einrichtungen zu etablieren Der folgende Abschnitt soll sich vor al lem mit den in diesen Empfehlungen spezifizierten technischen und organisatorischen Anforderungen und Empfehlungen an Hochschulschriftenserver kritisch auseinander setzen 16Zwar handelt es sich bei den Empfehlungen erst um eine vorl ufige Version und der Fokus liegt auf elektronischen Hochschulschriften und deren Behandlung trotzdem kommen einige bergeordnete internationale Entwicklungen wie etwa das oben eingef hrte OAI Protokoll leider gar nicht vor oder deutlich zu kurz 45 2 Aufgabenstellung Grundlagen Arbeitsabl ufe 2 4 2 2 Anforderungen an einen Hochschulschriftenserve
139. chenden Druckversion und das Konvertieren in das entsprechende Pr sentationsformat Tabelle 7 zeigt die f r die Metadaten der Hoch schulschrift relevanten Zust nde Zustand ZUSTANDSBESCHREIBUNG Validierung Prim rmetadaten Ausgangszustand Metadatensatz wird von SLUB Mitarbeitern auf Vollst ndigkeit und Richtigkeit der pri m ren Metadaten berpr ft Validierung Prim rmetadaten Die prim ren Metadaten konnten korrekt validiert werden OK Validierung Prim rmetadaten Schwerer technischer Fehler Die Prim rmetadaten konn Fehler ten nicht korrekt validiert werden Validierung Fachreferenten Metadatensatz wird jetzt von Fachreferenten bearbeitet welche zus tzliche sekund re Metadaten wie Klassifika tionen u Schlagworte aus Schlagwortnormdateien hinzuf gen Validierung Sekund rmetada Die sekund ren Metadaten werden von SLUB Mitarbeitern ten validiert Der gesamte Metadatensatz wird auf die Einstel lung in die persistente Datenbasis vorbereitet Validierung Sekund rmetada Endzustand f r Metadaten Die sekund ren Metadaten ten OK konnten korrekt validiert werden Validierung Sekund rmetada Fehler Die sekund ren Metadaten konnten nicht korrekt ten Fehler validiert werden Tabelle 7 Metadaten spezifische Zust nde Diese Zust nde spiegeln den sich auf die Metadaten beziehenden Teil der Ar beitsabl ufe aus Abschnitt wieder Prim rmetadaten des Autors validieren diese an den entsprechenden Fachr
140. chenden Suchanfragen bergeben die sie als HTTP Parameter erh lt Auch die dritte Teilanwendung und damit die Suche ist Session basiert realisiert was nicht notwendig ist aber eine Reihe von Vor teilen bietet die im weiteren Verlauf des Abschnitts deutlich werden sollten Da der Nutzer bei gro en Ergebnismengen nicht immer gleich alle Treffer sehen m chte erlaubt die Implementation der AccessTools lediglich Teilmengen des Gesamtergeb nisses zur ckzugeben sogenanntes Paging Dies wird insbesondere durch die Klasse HsssHitCollector realisiert welche die Treffermengen verwaltet Die Anzahl der Treffer die auf einmal zur ckgegeben werden sollen und andere Parameter sind inner halb der Benutzeroberfl che der AccessTools myHSSS einstellbar sie wird n her im nachfolgenden Abschnitt 6 3 vorgestellt 2 Dies wird bei der Pr sentation von Ergebnissen notwendig Die Seperator Zeichenfolge wurde mit xxx gew hlt und wird ebenfalls indexiert steht nicht in der Stopwortliste und wird auf jeden Fall angeh ngt auch bei einer Menge von eins Das hat den Vorteil dass auf diese Weise recht einfach nach allen Dokumenten innerhalb des Index gesucht werden kann m glichst zu einer Zeit wo keine oder nur sehr wenige Nutzer die Suchfunktionen von Lucene ber diesen Index nutzen 2 193 6 Teilanwendung 3 HSSS AccessTools myHSSS Jede der vom LuceneManager angebotenen Suchmethoden liefert ein Objekt vom Typ HsssHitCo
141. d insbesondere die Umsetzung der in Abschnitt aufgestellten Architekturvisionen drei und vier im Vordergrund F r die Prototyp Version der Benutzerschnittstelle der dritten Teilanwendung wurde der Name myHSSS gew hlt Anhand von Abbildung 56 soll zun chst der allgemeine Aufbau der Benutzeroberfl che erl utert werden SLUB AccessTools Microsoft Internet Explorer _ x Datei Bearbeiten Ansicht Favoriten Extras 2 ana la 3 DB 3 Zur ck Yowes Abbrechen Aktualisieren Startseite Suchen Favoriten Verlauf E Mail Drucken Bezbeiten Adresse ei http 7700102 slub dresden de hsss myhsss index isp Wechseln zu il Links FIREBALL HochschulSchriftenServer der SLUB Dresden Fragen oder ss SL Technische Probleme A AS UB Universit t Schicken Sie Dresden eine Email Volltextsuche Hilfetext Volltextsuche gt Volltextsuche Durchsucht das Dokuments nach men 10247768 12007900 einem Suchbegriff Meine Treffer 0 Treffer HSSS ae gt Bereichsauswahl Suchen R cksetzen Erm glicht die Begrenzung der Datens tze auf Felder und oder nur Volltext nur Felder Felder und Volltext den Volltext nur Volltext durchsucht nur den I detailierter Report Volltext nach dem eingegebenen R Suchbegriff fi O Ergebnisgr e nur Felder durchsucht nur die Felder z B Titel Autor nach dem eingegebenen Suchbegriff Wird der Platzhalt
142. d nun an die Akteu re SWB S dwestdeutscher Bibliotheksverbund und DDB Die Deutsche Bibliothek exportiert Als letztes ist der Metadatensatz in die persistente Datenbasis des Gesamt systems einzustellen Einen detaillierteren und zeitlich differenzierten berblick ber die beschriebenen Anwendungsf lle gibt wieder das dazugeh rige Sequenzdiagramm dessen erster Teil in Abbildung 5 zu sehen ist Referat 5 3 2 AdminTools Autor Validierung dey Dokumente Referate 10 11 Referat 3 4 2 Best tigung Felflermeldung 3 Validierung der Pfriml r Metadaten 4 3 Druckexempla it Vermerk el Dokumerit verf gbar 5 Best tigung 7 2 Druckexemplare Ausdruck der Primar Matadaten siehe Sequenzdiagr Referat 3 4 8 klassifizierte sacherschl Druckexemplare aida 9 2 klassifizierte sacherschl Druckexempl il Siansa 10 Sekundare Metadaten eingeben vallas l Abbildung 5 Sequenzdiagramm Gesch ftsgang in Bezug auf das Referat 5 3 Teil 1 Zun chst werden die Dokumente des Autors validiert 1 Wie bereits erw hnt schlie t das sowohl eine stichprobenartige Kontrolle der Pflichtexemplare Druckexem plare als auch den ebenfalls stichprobenartigen bereinstimmungsvergleich zwischen Druckexemplar und elektronischer Version der Dissertation ein Im Falle einer er folgreichen Validierung erh lt der Autor eine Best tigung ansonsten eine Fehlermel dung
143. datens tzen im Rahmen der Diplomarbeit wurde die dateibasierte Version des Belegs beibehalten dazu aber um eine datenbankbasierte Implementierung erg nzt Welche der beiden M glichkeiten verwendet werden soll kann ber die Konfigurationsdatei web xml eingestellt wer del Bei der dateibasierten Version wird die XML Struktur des entsprechenden Metadatensatzes an die schon vorhandenen Metadatensatzstrukturen in einer wieder ber die Konfigurationsstrukturen einstellbaren XML Daten Datej angeh ngt Bei der Datenbank Version wird die XML Struktur des Metadatensatzes in einer durch die Konfigurationsstrukturen bestimmbare Tabelle gespeichert Die Struktur des Datenmodells das bis zu diesem Zeitpunkt betrachtet werden muss ist dabei re lativ flach siehe dazu auch Anhang C ab Seite 259 Es existieren nur einige wenige Tabellen die entweder Konfigurationsstrukturen beinhalten wie etwa config_hsss oder config_metadatasets oder aber die XML Repr sentationen der Metadatens t ze temp_metadatasets Letztere Tabelle siehe dazu auch Abschnitt ab Seite ist nachfolgende abgebildet Name DATENTYP I P M BESCHREIBUNG id numeric 6 y y v Identifikationsnummer processingid char 100 y Bearbeitungsnummer unique kindofdocument varchar 30 vi Dokumentenart creationdate datetime y Eingangsdatum lastprocessingdate datetime y Datum der letzten Bearbeitung state varchar 30 y aktueller Bearbeitungszustand lastprocess
144. datensatzbeschreibung definiert sind 128 4 2 Realisierung 4 2 Realisierung Dieser Abschnitt soll die Realisierung der ersten Teilanwendung MetadatenGenerator anhand von einigen Screenshots beschreiben Dabei wird der im obigen Sequenz diagramm gezeigte Ablauf noch einmal verdeutlicht gleichzeitig kann das Layout der Benutzeroberfl che demonstriert werden Anhand der n chsten Abbildung wird bereits deutlich dass das Layout der Teilanwendung aus dem Gro en Beleg nahezu vollst ndig bernommen wurdd Abbildung 34 SLUB MetadatenGenerator Formular 1 Nachdem der Autor die URL der MetadatenGenerator Webanwendung angew hlt hat wird ihm zun chst ein Begr ungsformular pr sentiert das hier nicht abgebildet ist ber den Weiter Button gelangt er dann zu dem in Abbildung 34 gezeigten Formular In allen Formularen kann er jederzeit ber Abbrechen die Teilanwendung verlassen Klickt der Nutzer auf das MetadatenGenerator Symbol in der linken oberen Ecke gelangt er zu einem Konfigurationsformular in dem er z Bsp einstellen kann ob eine zus tzliche JavaScript Validierung erfolgen soll Standard oder ob er eine E Mail Benachrichtigung w nscht Standard Au erdem kann er Teile des Layouts wie etwa die Farbgestaltung etc beeinflussen ber die Buttons Weiter und Zur ck ist jederzeit die Navigation innerhalb des MetadatenGenerators m glich Dabei ist zu beachten dass erfolgte Eingaben e
145. datentyp Regulation H ufigkeit L ngenrestriktion der Tag der m ndlichen Pr fung DC Date Accepted de date accepted primary mandatory Dissertation nicht vorhanden Bericht 1 1 10 50 Tabelle A26 HSSS Metadatensatz Tag der m ndlichen Pr fung Bezeichnung TAG DER ABGABE DER HOCHSCHULSCHRIFT BEGUTACHTUNG Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Datum der Antragsstellung zur Promotion i d R ist das der Tag der Abgabe der Dissertation DC Date Submitted de_date_submitted primary mandatory Dissertation nicht vorhanden Bericht 1 1 10 50 Tabelle A27 HSSS Metadatensatz Tag der Abgabe 238 A 2 Spezifikation der Metadaten Bezeichnung TAG DER ABGABE DER HOCHSCHULSCHRIFT AN DIE SLUB Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Datum der Abgabe der von der Universit tsbibliothek akzeptier ten Pflichtexemplare DC Date Created de date created secondary mandatory 1 1 10 50 Tabelle A28 HSSS Metadatensatz Tag der Abgabe SLUB A 2 8 DC TYPE Bezeichnung DOKUMENTEN TYP Beschreibung Typ des Dokumentes zum Beispiel Habilitation DC Bezeichnung DC Type Parametername dc_type Metadatentyp primary Regulation mandatory H ufigkeit 1 1 L ngenrestriktion 5 100 Tabelle A29 HSSS Metadat
146. declare kindofdocument id numeric 4 5 select type_id select id from pers_ type where name type_name 6 if type_id is null 7 begin 8 select kindofdocument id select id from pers_kindofdocument where name kindofdocument 9 if kindofdocument id is null 0 begin 1 insert into pers kindofdocument name values kindofdocument 12 select kindofdocument id select id from pers_kindofdocument where name kindofdocument 13 if kindofdocument d is null 4 begin 15 select type_id 1 16 end 7 else 8 begin 19 insert into pers_ type name kindofdocument_id values type_ name kindofdocument _id 20 select type_id select id from pers type where name type_ name 21 end 22 end 23 else 24 begin 25 insert into pers type name kindofdocument id values ype name Okindofdocument id 26 select type_id select id from pers _type where name Otype_ name 27 end 28 end 29 end Listing 9 stored procedure 28 Bsp 1 call get_metadataset der zweite Platzhalter w rde im Beipiel mit 1 belegt der erste Platzhalter ist f r einen R ckgabeparameter registriert 171 5 Teilanwendung 2 AdminTools Diese gespeicherte Prozedur ist verantwortlich f r das Einstellen des Dokumenten typs einer Hochschulschrift und erh lt dazu von der Anwendung die Parameterwerte f r die Dokumentenart und den Dokumententyp Sie liefert der Anwendung die Iden tifikationsnummer f r den eingestellten Dokume
147. dem Package java security welcher sichere Zufallszahlen generiert 93 3 Systemarchitektur 3 3 1 2 Konfigurationsstrukturen Wie aus den Anforderungen an den HSSS und insbesondere aus den Architektur visionen hervorgegangen ist soll sich die Gesamtanwendung vor allem durch eine hohe Flexibilit t und eine weitgehende Konfigurierbarkeit auszeichnen So soll u a die Metadatensatzbeschreibung XML basiert vorliegen um bestimmte Verhaltens weisen der damit zusammenh ngenden Anwendungsteile von au en beeinflussen zu k nnen Eine solche externe Konfigurierbarkeit ist selbstverst ndlich auch f r ande re Anwendungsteile von gro em Vorteil Deshalb liegt die Vorstellung nahe gene rell und so weit wie m glich auf XML basierte Konfigurationsstrukturen zu setzen die dann allerdings einer gewissen Aufteilung bed rfen Mit der Architektur dieser Konfigurationsstrukturen und deren logischer Separierung soll sich dieser Abschnitt im weiteren Verlauf besch ftigen Die Verwendung von XML basierten Konfigurati onsdateien wird von der gew hlten Java basierten Servertechnologid sogar bereits unterst tzt Die Servlet Spezifikation von Sun verlangt die Existenz einer web xml zu benennenden Konfigurationsdatei f r jede Web Anwendung Der In halt dieser Konfigurationsdatei gehorcht einer bestimmten Dokumententypdefinition DTD und ist von dem entsprechenden Servlet Container bei der Initialisierung der Web Anwendung einzulesen und in
148. der Gesamtanwendung sind nat rlich auch unterschiedliche Informationen innerhalb der entsprechenden Bereiche der Konfigura tionsdatei web xml notwendig auf die nicht in allen Einzelheiten eingegangen wer den kann detaillierte Informationen zu einzelnen Konfigurationsparametern finden sich aber in Stattdessen sollen in der folgenden Aufz hlung die wichtigsten Informationen genannt werden die den Servlets vor allem den Servlets der Teilan wendungen auf diese Weise zur Verf gung stehen und somit flexibel konfigurierbar sind 251 B Konfigurationsstrukturen des HSSS Informationen die das Servlet bzw die Teilanwendung beschreiben Name Version Release Datum usw relative und absolute Pfade im Kontext der entsprechenden Teilanwendung Art der Persistenz Datei basiert Datenbank basiert Angaben zum Logging Bezeichnung der Log Datei en Logging anschalten ausschalten etc die Lokation weiterer Konfigurationsstrukturen in Abh ngigkeit von der Persis tenzart entweder Dateipfade oder Tabellen Spaltenbezeichnungen die Lokation von Stylesheets Formatvorlagen Transformationsbeschreibungen etc die Lokation der Daten in Abh ngigkeit von der Persistenzart entweder Da teipfade oder Tabellen Spaltenbezeichnungen Informationen ber das Layout der entsprechenden Teilanwendung 252 B 3 hsssdata xml B 3 hsssdata xml Diese Konfigurationsstruktur kann in Abh ngigkeit von der gew hlten Pers
149. dern vor allem was deren Benutzerfreundlichkeit die Dokumen tation und die Integration von Werkzeugen wie etwa JSPC betrifft Sicherheitsfunktionalit ten wie etwa das Zertifizieren des Hochschulschriftenser vers bzw der Hochschulschriften selbst sind schon in Abschnitt als eine wichtige in einer n chsten Ausbaustufe des HSSS zu realisierende Erweiterung in Zusammenhang mit der Unterst tzung einer Public Key Infrastructure PKI 222 8 2 Verbesserungsm glichkeiten angesprochen worden Deshalb soll diese Erweiterungsm glichkeit an dieser Stel le nicht weiter vertieft werden Auch die Unterst tzung einer Auszeichnungssprache wie die in Abschnitt vorgestellte DiML wurde bereits in Abschnitt 2 4 5 vorgeschlagen Dies setzt aber eine organisatorische und technische Erweiterung der Arbeitsabl ufe voraus sowie die Schulung von Mitarbeitern und Universit tsangeh rigen au erdem w re eine enge Kooperation mit den einzelnen Fakult ten notwendig um die entsprechende Formatvorlagen etablieren zu k nnen In einer n chsten Ausbaustufe ist zu berdenken ob das Gesamtsystem nicht auf einen J2EE Application Server portiert werden sollte DeP00 Durch die Komplexit t die die Gesamtanwendung inzwischen erreicht hat erscheint dieser Schritt sinnvoll Die Gesamtanwendung des HSSS hat schon jetzt einen betr chtlichen Umfang auch was die Zahl der Klassen und JSP Dateien betrifft Dadurch dass bei dem ersten Zugriff nach dem
150. die bereits ber ein halbes Jahr vorher in einem eindringlichen Appell die Verwendung der OAI Empfehlungen und des OAI Protokolls angemahnt hat 47 2 Aufgabenstellung Grundlagen Arbeitsabl ufe DINI Arbeitsgruppe folgerichtig auch fast jeder der vorgestellten Technologieberei che in die Rubrik Weiterbildung eingeordnet besonders die Bereiche Konvertierung Umgang mit digitalen Signaturen Zertifikaten und PKI sowie Metdatendatenanwen dungen hier speziell Dublin Core Den umfangreichsten Teil des Dokuments stellt der siebente Abschnitt dar der mit Technologie konkrete Beispielgesch ftsg nge berschrieben ist Hier sollen insbesondere auch die schon in vorangegangenen Abschnitten beschriebenen Vorge hensweisen konkretisiert und praktisch veranschaulicht werden Leider wird in vielen F llen das vorangegangene lediglich wiederholt bzw noch weiter vertieft was in einem gewissen Widerspruch zum Titel des Abschnitts steht Interessant sind die vorgestell ten Beispielgesch ftsg nge einiger Institutionen die sehr gut als Ausgangspunkt f r die Entwicklung eigener Gesch ftsg nge bzw Arbeitsabl ufe verwendet werden k n nen Danach werden Anforderungen an die Formate eines Archivs gestellt Zu die sen Anforderungen geh ren unter anderem die der Zitierf higkeit der Seitenechtheit der Druckbarkeit der Lesbarkeit im Internet Hypermediaf higkeit der Archivierf higkeit der Recherchierbarkeit sowie der leic
151. die rechlichen Bedingungen version varchar 100 WJ Version url varchar 255 URL unique name version Tabelle A74 die Tabelle pers_rights pers_subject Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV v y eindeutige Identifikationsnummer f r die Tabelle subject varchar 255 y Schlagwort Klassifikation unique subject Tabelle A75 die Tabelle pers_subject pers_contributor Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle university varchar 100 y Universitat faculty varchar 100 WJ Fakult t department varchar 100 Fachbereich institute varchar 100 Institut address_id numeric 6 ES Adresse der Einrichtung Fremdschliis sel address_id references pers_address id unique university faculty department institute Tabelle A76 die Tabelle pers_contributor 269 C Datenbank Schema des HSSS pers_publisher BESCHREIBUNG Name DATENTYP id numeric 4 name varchar 255 address_id numeric 6 lt lt U E a eindeutige Identifikationsnummer f r die Tabelle Name der Universit tsbibliothek bzw des Ver ffentlichers Adresse der Universit tsbibliothek des Ver ffentlichers Fremdschl ssel address_id references pers_address id unique name Tabelle A77 die Tabelle pers_publisher pers_type Name DATENTYP I P M BESCHREIBUNG id numeric 4 vV v
152. diesem Grund l sst sich der Ar beitsgang der Behandlung gedruckter Berichte kaum in den f r elektronische Berichte integrieren und soll auch nur am Rande behandelt werden da der Fokus der Diplom arbeit ja auf der Behandlung elektronischer Dokumente liegt F r den Spezialfall dass auch ein Bericht zur gleichen Zeit sowohl gedruckt als auch in seiner digitalen Form im Referat 5 3 eintrifft n hert sich das im folgenden gezeigte Gesch ftsmodell f r Be richte allerdings dem f r Dissertationen an Ansonsten ist das Gesch ftsmodell f r Berichte aufgrund der Tatsache dass fast ausschlie lich die elektronische Version des Dokuments vom Modell ber cksichtigt wird entsprechend weniger komplex und soll daher auch lediglich in zwei Sequenzdiagrammen erl utert werden Das erste dieser Diagramme ist in Abbildung 9 auf der folgenden Seite abgebildet Zun chst nutzt der Autor eines Berichtes ebenfalls die Anwendung Metadaten Ge nerator um dem System die Metadaten zu seinem Dokument zu bermitteln 1 Der MetadatenGenerator informiert wieder das Referat 5 3 ber den Eingang eines neuen Metadatensatzes 2 und verschickt gegebenenfalls eine Best tigung an den Autor 3 Der Autor gibt daraufhin die elektronische Version des Dokuments bei der SLUB al 4 Dort wird das elektronische Dokument durch ein formales Priifen der Datei validiert 5 Anschlie end erh lt der Autor eine Best tigung oder eine unter Nutzung einer der bereits
153. dungen ergibt Ein weiterer Kritikpunkt zudem informationstechnisch von viel gr erer Tragweite ist die Tatsache das Druckexemplar und elektronische Version desselben Dokuments aus bibliothekarischem Blickwinkel als unterschiedliche Ressourcen betrachtet werden und damit auch zweimal und sehr wahrscheinlich unterschiedlich katalogisiert wer Min diesem Fall ber die AdminTools Schnittstelle 12 1nd m glicherweise in einer weiteren Ausbaustufe des HSSS realisierbar 13jm Gegenteil sie ist sogar relativ leicht realisierbar da die gesamte Architektur auf ein verteiltes Arbeiten ausgelegt ist 74 3 1 Gesch ftsmodelle und Arbeitsabl ufe den Hier m sste strikt falls berhaupt notwendig zwischen der Repr sentation und dem Inhalt einer Ressource unterschieden werden Der Inhalt der elektronischen Versi on und des Druckexemplars einer Ressource ist n mlich derselbe zumindest sollte es so sein daher sollten nat rlich auch alle prim ren und sekund ren Metadaten identisch sein so dass sich eine zweimalige Katalogisierung eigentlich von selbst verbietet Die Repr sentation einer Ressource kann sich hingegen sehr wohl unterscheiden und er fordert gegebenenfalls auch unterschiedliche Beschreibungen dann allerdings getrennt vom Inhalt oder jeweils mit dem Verweis auf dieselbe Inhaltsbeschreibung Leider ist es aber g ngige Praxis f r jede Repr sentation einer Ressource bzw im Printbereich sogar f r jede Auflage einer
154. e BESCHREIBUNG config_hsss config_metadatasets stat_metadatasets temp_metadatasets temp_metadatasets_finished pers_address pers_date pers_description pers_format pers_kindofdocument pers_language pers_person pers_publication pers_relation pers_rights pers_subject pers_contributor pers_publisher Diese Tabelle hsssdata xml Diese Tabelle enth lt die XML basierten Metadatensatzbe schreibungen f r die vom HSSS unterst tzten Dokumentenar ten enth lt die Konfigurationsstruktur Diese Tabelle enth lt statistische Informationen zu den einzel nen Metadatens tzen Diese Tabelle enth lt die XML basierten tempor ren Metada tens tze Diese Tabelle enth lt die XML basierten Metadatens tze die bereits eingestellt sind als Proxy Diese Tabelle enth lt alle Adressen z Bsp von Universit ten Fakult ten etc Diese Tabelle enth lt Datumsangaben Diese Tabelle enth lt Beschreibungen Abstracts der Hoch schulschriften Diese Tabelle enth lt verwendete Dokumenten Formate Diese Tabelle enth lt alle Dokumentenarten Diese Tabelle enth lt Informationen zu verwendeten Sprachen Diese Tabelle enth lt alle Personen Diese Tabelle enth lt Informationen zu Ver ffentlichungen Diese Tabelle enth lt alle Relationen zu anderen Ressourcen Diese Tabelle enth lt alle verwendeten rechtlichen Bedingun gen Diese Tabelle enth lt alle verwendeten Schlagworte bzw Kla
155. e se Thematik sehr ausf hrlich im Rahmen der Belegarbeit abgehandelt wurde und sich zudem in diesem Bereich so gut wie keine nderungen ergaben ist der Umfang der Ausf hrungen relativ gering wobei aber auf die Belegarbeit als zus tzliche In formationsquelle verwiesen werden kann Schb00 Dort wurde bereits eine begr ndete Technologieentscheidung zugunsten einer Java basierten Plattform Servlets Java Ser verPages getroffen An dieser Entscheidung die durch die im Beleg entstandenen Er gebnisse auch absolut best tigt werden konnte wird im Diplom festgehalten Auch an den Komponenten Webserver Apache und Servlet Container Tomcat werden keine Ver nderungen vorgenommen Insgesamt ergibt sich das in der aus entliehe nen Abbildung 19 gezeigte Zusammenspiel dieser Komponenten als Infrastruktur f r die Gesamtanwendung Aufruf Aufruf Aufruf 7 1 Serviet Thread D leichtgewicht Java API 2 Aufruf Prozess bessen E Java API 1 Browser Webserver Servlet Container Abbildung 19 An der Gesamtanwendung beteiligte Komponenten 96 3 3 Architekturdetails Der Apache Webserver leitet die Nutzeranfragen f r die jeweiligen Webanwendun gen ber ein spezielles ModuP an den Servlet Container Tomcat weiter Dieser ist in der Lage diese Anfragen zu beantworten wobei die Abbildung noch einmal verdeut licht dass Tomcat f r jede parallele Anfrage lediglich einen neuen Thread erzeugt was insbesondere bei gro
156. e ung einschl Zeitschriften und ZDB sowie non book materials Diese Referate erschlie en die entsprechenden Materialien f r den Alphabetischen Katalog dabei erfolgt f r Monogra phien bzw Zeitschriften eine Verbund Katalogisierung nach formalen Gesichtspunkten f r elektronische Dissertationen wie auch f r andere Medien erfolgt die Hochkatalogisie rung in Zusammenarbeit mit dem SWB Referat 5 3 Referat f r Informationsvermittlung und neue Dienstleis tungen Dieses Referat ist unter anderen f r die Informationsver mittlung elektronischer Datenbest nde wie z Bsp CD ROM Datenbanken Online Datenbanken und elektroni schen Zeitschriften sowie f r die Entwicklung und Organisa tion aller Gesch ftsabl ufe im Bereich des Hochschulschrif tenservers HSSS verantwortlich Referat 10 11 Zweigbibliotheken und Fachreferate Diese Referate sollen f r den jeweiligen Fachbereich eine n Bestandsaufbau pflege erschlie ung und vermittlung realisieren und sind au erdem jeweils f r Fachinformatio nen zust ndig Tabelle 2 Am Gesch ftsmodell beteiligte Abteilungen der SLUB dabei steht Referat 10 f r alle Referate der Abteilung 10 gleiches gilt f r Referat 11 63 3 Systemarchitektur 3 1 1 Gesch ftsmodell f r Dissertationen Aufgrund der Komplexit t des gesamten Arbeitsablaufs wird dieser in mehrere chrono logisch aufeinanderfolgende Teile zerlegt wobei die Betrachtung gleichzeit
157. e Anwendung ist f r den Nutzer wie gewohnt zu erreichen und verlangt nicht die Existenz eines Browsers Gerade f r unerfahrene Anwender ist das ein wich tiger Punkt e Die Anwendung ist auch verf gbar wenn der Klient offline ist Diese Vorteile wiegen um so schwerer je komplexer die betrachtete Nutzerschnitt stelle ist und je kritischer Eigenschaften wie zuverl ssige Verf gbarkeit und Antwort zeitverhalten sind Seit einiger Zeit gibt es nun im Java Bereich eine Technologie die es laut SUN erm glicht die Vorteile der beiden Ans tze miteinander zu kombinieren Die Technologie hei t Java WebStart L JW und basiert auf dem Java Network Laun cher Protocol JNLP welches ein Protokoll f r ein webzentriertes Anwendungsmodell im Bereich von Java Technologie realisiert Hol00 Eine Anwendung ist demnach eine Ressource die sich an einem beliebigen Ort im Netz befindet Der Anwender entschei det ob das Programm geladen und ausgef hrt werden soll und welche Rechte es dabei hat WebStart ist lediglich eine Referenzimplementation eines JNLP Clients Folgen de Schritte werden vom Protokoll und den beteiligten Komponenten realisiert stark vereinfacht e Der JNLP Client also zum Bsp WebStart holt die ben tigten Programmteile vom Webserver des Herstellers und speichert diese im lokalen Cache Eine soge nannte JNLP Datei enth lt dabei XML basiert alle Deployment Informationen des entsprechenden Programms so dass f r den An
158. e Wertigkeit der einzelnen Treffer zueinander so dass eine neue Reihenfolge bei Treffersammlungen entsteht Die Klasse FieldSearchString kapselt eine Teil Suchanfrage bei der Feldsuche Sie besteht aus der eigentlichen Suchanfrage f r das jeweilige Feld sowie zwei boolischen Werten die das Auftreten dieses Suchaus drucks im Verh ltnis zu dem anderer Felder beschreiben sinnvoll beispielsweise wenn der gesamte Index vollst ndig neu erstellt werden soll 191 6 Teilanwendung 3 HSSS AccessTools myHSSS Dabei handelt es sich um die Parameter e required bestimmt ob der Teilausdruck im Gesamtergebnis vorkommen muss e prohibited bestimmt ob der Teilausdruck im Gesamtergebnis nicht vorkommen darf Damit ergeben sich die drei Kombinationen muss required true prohibited false kann required false prohibited false und nicht required false prohibited true HsssStopAnalyzer ist eine Klasse welche die abstrakte Klas se Analyzer aus dem Package com lucene analyses erweitert siehe Abschnitt 6 2 1 und um eine deutsche Stopwortliste erg nzt Eine Klasse die einen deutschen Stemming Algorithmus implementiert konnte aufgrund der knappen Zeit im Rahmen der Di plomarbeit nicht mehr realisiert werden und verbleibt daher als Erweiterungsm glich keit f r sp tere Ausbaustufen des HSSS Der LuceneManager wird als Erstes daf r genutzt um einen Index zu erstellen Voraussetzung daf r ist die Definition eines Dokument
159. e der Gesamtanwendung wie etwa die dritte Teilan wendung sind aber auch v llig neu ohne R ckgriff auf die Belegarbeit zu entwickeln dazu geh rt z Bsp die Umstellung der Persistenzrealisierung von einer dateibasierten L sung Beleg auf eine datenbankbasierte L sung Diplom Noch interessanter w re eine Realisierung die es erm glicht wahlweise dateibasiert oder datenbankbasiert zu speichern Der in der Aufgabenstellung angesprochene Einsatz von XML Technologie ist f r alle Teilbereiche der Anwendung zu pr fen insbesondere f r solche mit Daten austausch z Bsp Metadatenexport an die entsprechenden Institutionen Auch zur Pr sentation von Zwischenergebnissen z Bsp Teile der Metadaten k nnte sich diese Technologie eignen Ein wichtiges Ziel der Diplomarbeit sollte es sein einen umfassenden Arbeitsablauf f r den Gegenstandsbereich zu definieren und ihn detailliert auf seine Praxistauglich keit hin zu berpr fen Deshalb sollten nachdem die erste und die zweite Teilan wendung fertig gestellt sind alle damit verbundenen Arbeitsabl ufe getestet werden Dazu geh rt auch dass die Lesbarkeit der exportierten Metadaten nachgewiesen wer den kann Um die Arbeitsabl ufe zu festigen sollten eine Reihe von schon vorhandenen echten Daten in dieser Weise mit den zwei Teilanwendungen bearbeitet werden Da nach m ssen die jetzt vollst ndigen Metadaten persistent in die Datenbank eingestellt werden Zu diesem Zweck ist ein Date
160. e partiell realisierte Anwendung die die Auswertung und Bearbeitung der Metadaten erlaubt Aus der Aufgabenstellung der Diplomarbeit bzw aus den Anforderungen respek tive Empfehlungen von DINI und Dissertationen Online sowie aus eigenen berle gungen ergeben sich folgende weitere Merkmale die der HSSS unterst tzen wird e Das schon vorhandene Gesch ftsmodell wird erweitert und insbesondere in den Punkten interne und externe Kommunikation verbessert und abgestimmt Die Praxistauglichkeit und Funktionst chtigkeit der spezifizierten Arbeitsabl ufe wird durch Tests nachgewiesen e Die Metadaten zu den Dokumenten werden persistent abgelegt Die Persistenz wird dabei durch ein noch zu bestimmendes DBMS realisiert e Durch die Verwendung einer Indirektion stabile URL wird die langfristige Ver f gbarkeit einmal publizierter Dokumente sichergestellt e Die Metadatens tze werden bis auf die endg ltige Speicherung im DBMS im XML Format vorgehalten Dies erm glicht einen flexibleren Umgang mit den Metadaten und erleichtert die bertragung bzw den Export an andere Institu tionen e Alle Anwendungen werden durch die Integration von XML basierten Konfigura tionsdateien u erst flexibel und von au en ver nderbar gestaltet e Die Anwendung zur Bearbeitung und Administration der Metadaten wird ver vollst ndigt und unterst tzt die spezifizierten Arbeitsabl ufe bis hin zur persis tenten Speicherung in das DBMS so perfekt wie
161. ebene Seite mit der Metadatensatz bersicht wo der gerade bearbeitete Me tadatensatz der jeweiligen Dokumentenart noch selektiert ist Durch ein Klicken des in diesem Beispiel wird angenommen dass es sich um die Dokumentenart Dissertation handelt 154 5 2 Realisierung Buttons Drucken gelangt der Nutzer auf eine Seite die Teile der prim ren Metada ten des ausgew hlten Metadatensatzes in einer druckfreundlichen HTML Pr sentation zeigt welche durch ein Klicken auf Drucken ausgedruckt werden kann Alterna tiv kann von der Anwendung auch ein entsprechendes PDF Dokument zur Laufzeit aus den Metadaten erstellt werden welches ber ein entsprechendes Plugin wie in Abbildung 43 gezeigt integriert wird Meidetens ze _Metsdsenenerscr ABS Be a Els rm DON a Dissertation Interkulturelles Lernen als organisationale F higkeit international t tiger Unternehmen Eingangsdatum 6 6 2001 um 11 2 46 Uhr Sprache des Dokuments Deutsch Originaltitel Interkulturelles Lernen als organisationale F higkeit international t tiger Unternehmen Untertitel ein ressourcenorientierter Ansatz bersetzter Titel nicht angegeben Verfasser a IE ln EME _Abtrechen mm Emai Por Abbildung 43 HSSS AdminTools Druck Pr sentation der Prim r Metadaten Der Nutzer kann aber auch durch ein Klicken auf E Mail im unteren Teil der Abbildung automatisch ein von Web basierten
162. eferenten weiterleiten die von ihm erstellten Sekund r Metadaten eingeben und validieren Neben diesen beiden internen Zustandsarten exis tiert zus tzlich ein nach au en sichtbarer Gesamtzustand der sich nat rlich zumin dest teilweise aus den beiden internen Zustandsarten ergibt Dieser Gesamtzustand ist z Bsp durch die im Abschnitt 4 4 2 beschriebene Anwendung sichtbar welche dem Autor den aktuellen Bearbeitungsstatus seiner Hochschulschrift mitteilt Die Gesamt zust nde dieser Teilanwendung zusammen mit vorauszusetzenden internen Zust nden Dokumentenzust nde bzw Metadatenzust nde sind in Tabelle 8 auf der folgenden Seite abgebildet 147 5 Teilanwendung 2 AdminTools Gesamtzustand METADATENZUSTAND DOKUMENTENZUSTAND Neu Registriert in Bearbeitung Validierung Prim rmetadaten OK Vorgang suspendiert Validierung Prim rmetadaten Validierung Dokument Fehler Export Vorgang abgeschlossen Fehler nicht durch Referat 5 3 reparierbar Validierung Sekund rmetadaten OK Validierung Sekund rmetadaten Konvertierung Dokument Fehler Dokument l sst sich berhaupt nicht konvertieren Dokument OK OK Tabelle 8 Gesamtzust nde und Abh ngigkeiten Neben den hier gezeigten Zust nden gibt es noch weitere Parameter die auf das Ablaufverhalten der Teilanwendung einen Einfluss haben durch die internen Zust nde der zwei existierenden Kategorien aber nicht beschrieben werden k nnen Als
163. egebenen OAI Identifier liefert die Formate f r einen gegebenen OAI Identifier liefert die Sprache f r einen gegebenen OAI Identifier liefert die universit re Einrichtung f r einen gegebenen OAI Identifier liefert den Ver ffentlicher Universit tsbibliothek f r einen gegebenen OAI Identifier liefert die rechtlichen Bedingungen f r einen gegebenen OAI Identifier liefert die absolute URL f r einen gegebenen OAI Identifier liefert die Literaturquellen f r einen gegebenen OAI Identifier testet ob ein gegebener OAI Identifier exisitiert liefert alle absoluten URL s des Archivs in einem gegebenen Datumsbereich bzw f r einen gegebenen Set Tabelle A59 bersicht der gespeicherten Prozeduren Teil 2 264 C 2 Schema C 2 Schema config_hsss Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle lastchanged datetime y Datum der letzten nderung hsssdataxml text Die XML basierte Konfigurationsstruk tur Der Wert null ist erlaubt damit nicht von vornherein 2K belegt werden Tabelle A60 die Tabelle config_hsss config_metadatasets Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV Vv y eindeutige Identifikationsnummer f r die Tabelle kindofdocument varchar 30 Y Dokumentenart Dissertation Bericht lastchanged datetime y Datum der letzten nderung metadatasetxml text Die XML basierte Konfigu
164. einem abgestimm ten kompatiblen und auf hohe Verf gbarkeit orientierten Konzept aufgebaut wurde so dass eine gemeinsame Nutzung mehrerer Archive gar nicht oder nur eingeschr nkt und mit erheblichem Aufwand verbunden m glich sei In vielen F llen ist sowohl die Persistenz der Datens tze als auch deren Beschreibung in Metadatens tzen kaum gegeben Da dieser Zustand die nationale und internationale wissenschaftliche Kom munikation in erheblichem Ma e behindert bedarf die Situation einer m glichst ra schen Verbesserung die nach Ansicht der DINI am ehesten durch die Implementa hier bietet sich insbesondere SOAP Simple Object Access Protocol an 44 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld tion des OAI Standards gegeben ist Daher empfiehlt die DINI unter anderem auch den Einrichtungen die in Deutschland ber die F rderung von Projekten im Zu sammenhang mit wissenschaftlicher Kommunikation entscheiden die Einhaltung der OAI Spezifikationen zur Voraussetzung f r die Bewilligung solcher F rderantr ge zu machen Innerhalb der DINI gibt es verschiedene Arbeitsgruppen die sich mit jeweils un terschiedlichen Schwerpunktthemen besch ftigen Von besonderem Interesse f r den Bereich von wissenschaftlichen Dokumentenservern und Archiven im allgemeinen und damit auch f r den HSSS im besonderen ist dabei die DINI Arbeitsgruppe Informa tionsdienste und Standards f r das elektronis
165. einem bestimmten dem Servlet verf gbaren Ob jekt javax servlet ServletConfig abzulegen Listing 6 zeigt die grundlegende Struktur dieser Konfigurationsdatei 1 lt xml version 1 0 encoding I1SO 8859 1 gt 2 lt DOCTYPE web app PUBLIC 3 Sun Microsystems Inc DTD Web Application 2 2 EN http java sun com j2ee dtds web app_2 2 dtd gt lt web app gt lt servlet gt lt servlet name gt MetadataGeneratorServlet lt servlet name gt lt servlet class gt hsss metadatagenerator MetadataGeneratorServlet lt servlet class gt lt init param gt lt param name gt servlet version lt param name gt lt param value gt 1 5b3 lt param value gt lt init param gt lt init param gt lt param name gt file hsssdata xml lt param name gt lt param value gt d jakarta tomcat 3 2 hsss xml hsssdata xml lt param value gt lt init param gt lt servlet gt lt servlet gt OA NOT E Go Ma OG DD 4 OO N o 21 lt servlet gt 22 USW 23 lt web app gt Listing 6 grundlegende Struktur der Konfigurationsdatei web xml 35 weitere Informationen zu Architektur Details der Server Ebene finden sich im anschlie enden Ab schnitt 3 3 2 94 3 3 Architekturdetails Dabei wird deutlich dass sich eine solche Konfigurationsdatei auf genau eine Web Anwendung bezieht lt web app gt f r Web Application welche wiederum aus einer beliebigen Anza
166. eiterung betrifft die Grundlage des Gesamtsystems die Basistechnologien auf denen alle anderen Teile der Anwendung aufbauen soll ten stets so aktuell wie m glich gehalten werden Zu diesen Basistechnologien z hlen zum Beispiel die Programmiersprachenumgebung also das JSDK das Datenbankverwaltungssystem und der Servlet Container Die n chste Version des JSDK Version 1 4 wird kurze Zeit nach Fertigstellung der Diplomarbeit erscheinen und bietet einige Neuerungen im XML Bereich sowie eine bessere Performance und Stabilit t der Virtuellen Maschine VM sowie Verbesserungen der Hot Spot Technologie Au erdem ist die Java WebStart Technologie von der bereits in Abschnitt 3 3 3 2 die Rede war in dieses Release integriert worden Der Datenbankserver Adaptive Server Enterprise ist bereits kurz vor dem Ende der Diplomarbeit in der neuen Version 12 5 vorgestellt wurden allerdings war die Zeit zu kurz um die Anwendung noch umzustellen Die neue Version des Daten bankservers bietet jedoch eine Reihe von Vorteilen insbesondere was die Java bzw XML Unterst tzung betrifft Der ServletContainer Tomcat macht mit der n chsten Versionsnummer 4 0 nicht nur einen gro en Versionssprung sondern implementiert auch gleich die jeweils aktuellsten Spezifikationen der Servlet bzw JSP Technologie Dadurch ergeben sich neue interessante Funktionalit ten wie zum Beispiel ServletFilter Aber auch die Umgebung des Servlet Containers wird sich stark ver n
167. elfach enthalten moderne Datenbanken zus tzliche Funktionalit ten in Form von integrierten Volltextsuchmaschinen oder diese Funktionalit ten sind nach r stbar Sie erlauben in der Regel eine optimale Integration des vorhandenen Datenbankschemas Selbstverst ndlich haben solche Datenbanken bzw die ent sprechenden Volltextmodule ihren Preis e Au erhalb der Datenbank durch die Nutzung einer externen Volltext suchmaschine Externe Volltextmaschinen sind auf die Suche innerhalb von indexierten Texten spezialisiert und sollten deshalb exakte Suchergebnisse mit einer guten Perfor mance liefern Leider besteht hier das Problem dass man diese Komponente zus tzlich in das System integrieren und die Synchronit t von Datenbasis und Volltextindex gew hrleisten muss Der erste Ansatz verlangt selbst ohne Realisierung der Suche in den Volltexten einige Investitionen in das Datenbankschema welches dadurch zus tzlich verkompli ziert w rde Um beispielsweise auch bei gro en Datenmengen in einer annehmbaren Geschwindigkeit die Beschreibungen oder Titel der Hochschulschriften nach einzelnen Worten durchsuchen zu k nnen m sste auch eine separate Tabelle f r einzelne Wor te geschaffen werden Zus tzlich m sste es eine Tabelle mit Stopworten geben 10Die einzelnen Worte sind Prim rschl ssel und werden indiziert Andere Ans tze wie die Nutzung des SQL Operators like sind aufgrund mangelnder Performance nicht praktikabel Il Zo beachten is
168. em Muster existieren weitere gespeicherte Prozeduren auch f r die ande ren Dublin Core Kategorien die ein relativ bersichtliches und bequemes Einstellen f r die Anwendung innerhalb einer Transaktion erlauben Im Vergleich zu den an deren M glichkeiten l sst sich dadurch sowohl die Zahl der SQL Anfragen als auch deren Komplexit t deutlich reduzieren Auch f r andere Teile der Anwendung die mit der Datenbank interagieren und bei denen es auf eine m glichst hohe Performan ce ankommt wurden immer gespeicherte Prozeduren verwendet soweit dies m glich war Der einzige Nachteil der durch die Verwendung gespeicherter Prozeduren ent steht besteht in der fehlenden Standardisierung so dass sie in den meisten F llen 29Es sind hier zwei Strategien m glich entweder wird zuerst tiberpiift ob der Dokumententyp schon existiert oder es wird sofort probiert ihn einzustellen Um den Gesamtablauf zu optimieren muss diejenige Strategie als erstes gew hlt werden die mit der gr ten Wahrscheinlichkeit sofort zum Erfolg f hrt Im eingeschwungenen Zustand des Systems ist das die Strategie die davon ausgeht dass der Dokumententyp bereits existiert 30Dieser aufwendigste Fall kann allerdings nur zweimal auftreten da im Moment nur zwei Dokumen tenarten unterst tzt werden 3lLeider sind einige Datentypen f r gro e Datenmengen z Bsp text binary etc nicht in Verbin dung mit gespeicherten Prozeduren verarbeitbar 172 5 3 Persist
169. ement obligatorisch mandatory oder optional optional ist beschreibt wie oft das entsprechende Subelement auftreten darf min max beschreibt sinnvolle L ngenangaben f r die Subelements min max Tabelle A1 Kriterien f r die Metadatenbeschreibung Die Metadatens tze f r die beiden Dokumentenarten Dissertation und Bericht wer den anhand der eben eingef hrten Kriterien gemeinsam beschrieben Sollten bei einzel nen Subelements bei einigen Kriterien Unterschiede bestehen werden diese im Hinblick auf die entsprechende Dokumentenart Dissertation Bericht ausgewiesen 230 A 2 Spezifikation der Metadaten A 2 Spezifikation der Metadaten A 2 1 DC TITLE Bezeichnung ORIGINALTITEL DER ARBEIT Beschreibung Der originale Titel der Dissertation Habilitation Unter Um DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion st nden auch ein fremdsprachlicher Titel in Abh ngigkeit von DC Language DC Title de_title primary mandatory 1 1 10 255 Tabelle A2 HSSS Metadatensatz Originaltitel des Dokuments Bezeichnung UNTERTITEL WEITERER TITEL Beschreibung Eine Liste von weiteren Titeln z Bsp Untertiteln DC Bezeichnung DC Title Alternative Parametername dc_title_alternative Metadatentyp primary Regulation optional Anzahl 0 10 L ngenrestriktion 10 255 Tabelle A3 HSSS Metadatensatz Untertitel weitere T
170. en au erdem wird kurz auf die besonde ren Schwierigkeiten in Bezug auf Multimediadokumente eingegangen Hier wird als besonders kritisch eingesch tzt dass sowohl die Zahl der sich am Markt befindlichen Autorensysteme als auch die Zahl der Multimediaformate inzwischen fast schon un berschaubar geworden ist Daraus resultieren sowohl Probleme f r den Autor eines Multimediadokuments die Wahl eines ad quaten Autorensystems als auch f r den Betreiber des entsprechenden Dokumentenservers Formatunterst tzung Persistenz realisierungen etc Der Abschnitt schlie t mit dem Hinweis m glichst offene Stan dards und speziell bei der Archivierung strukturierte Formate wie SGML bzw XML zu verwenden Im Bereich Authentizit t geht es der Arbeitsgruppe vor allem darum die Urheberschaft der wissenschaftlichen Publikation vor F lschungen und Manipula tionen gesichert zu sehen Um dies gew hrleisten zu k nnen sollen Autor Inhalt und Ver ffentlichungszeitpunkt der Publikation vom Dokumentenserver signiert werden Das setzt nat rlich die Einbindung in eine Public Key Infrastructure PKI und die Nutzung digitaler Zertifikate voraus Ein zweiter Punkt ist die Sicherung des gesamten Dokumentenservers vor unbefugtem Zugriff und Manipulationen 46 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld Im Folgenden gehen die Empfehlungen auf die Bedeutung von Metadaten f r die langfristige Archivierung von digital
171. en Dokumenten ein Hier taucht zum ersten und einzigen Mal ein Hinweis auf die Open Archives Initiative auf So hei t es w rtlich Die Einbindung in vernetzte Strukturen und Retrievalsysteme setzt voraus dass eine deutschlandweite Einigung zu elektronischen Hochschulpublikationen existiert oder die Empfehlungen der OAI genutzt werden 77 Nach einer kurzen Definition von Me tadaten wird vor allem der Dublin Core Element Set n her erl utert Offen bleibt f r den Leser ob es wom glich ein deutschlandweit g ltiges Schema f r die Definition von Metadatens tzen nach Dublin Core gibt Der sich anschlie ende Retrieval Abschnitt gibt einige typische Recherchestrategien vor die Dokumentenserver unterst tzen soll ten Hierbei handelt es sich neben Navigation bzw Browsing im Wesentlichen um die Freitextsuche bei der in den Metadaten der Dokumente gesucht wird um die Feldsuche die eine erweiterte Form der Freitextsuche darstellt sowie um die Volltext suche die sich auf den Volltext des Dokuments bezieht Auch die Metasuche wird kurz erw hnt allerdings nur im Zusammenhang mit dem Z39 50 Protokoll und leider nicht in Hinblick auf die OAI Alternative hnlich den Er rterungen am Anfang des Kapitels zur Problematik erfolgreicher Archivierung kommt auch die Arbeitsgruppe zu dem Schluss dass im Sinne einer m glichst erfolgreichen und stabilen Langzeitarchi vierung die zu w hlenden Multimediaformate m glichst flexibel und strukturiert sow
172. en Metadaten f r die elektronische Version des Dokuments Die solcherart klassifizierten Druckexemplare und die sekund ren Metadaten schickt der Fachreferent wieder an das Referat 5 3 zur ck 8 welches die beiden klassifizierten Druckexemplare an das Referat 3 4 sendet 9 Die dortigen Aktionen werden in dem bereits erw hnten separaten Sequenzdiagramm beschrieben Die vom Fachreferenten erhaltenen sekund ren Metadaten werden nun von Mitarbeitern des Referats 5 3 unter Verwendung der Administrationsanwendung AdminTools in das System eingegeben und validiert 10 Alle weiteren speziell das Referat 5 3 betreffenden Aktionen wer den im zweiten Teil des Sequenzdiagramms beschrieben welches in Abbildung 6 zu sehen ist Referat 5 3 AdminTools Referat 4 1 4 2 11 Metadatenexport Metadatenexport DDB Metadatenexport SWB 12 Erfolgsmeldung l 13 Generiert MAB Datdnsatz l 14 sol einer rem Meldung ai berpr fung des MBB Datensatzes 17 Endg ltiges a des Metadatensatzes 7 a i l Abbildung 6 Sequenzdiagramm Gesch ftsgang in Bezug auf das Referat 5 3 Teil 2 15 Melaling des Vorhandenseins eines MAB Datensatzes 6Zu den sekund ren Metadaten die der Fachreferent erstellt geh rt die Einordnung in verschiedene Klassifikationen z Z DNB RVK sowie die Schlagwortvergabe nach Schlagwortnormdatei SWD siehe auch Abschnitt 4 2 auf Seite im Anhang
173. en Such bzw Navigationsm glichkeiten Rechts befindet sich ein Bereich der f r die Darstellung der kontextsensitiven Hilfe benutzt wird die somit f r den Nutzer immer verf gbar ist Standardm ig startet myHSSS in der Aufl sung 600 600 wie in Abbildung 56 zu sehen ist Durch das Klicken auf einen der vier Aufl sungs Buttons ist vom Nutzer aber jederzeit eine nderung der Skalierung in den vorgegebenen Bereichen realisierbar In Abbildung 57 wurde die Aufl sung beispielsweise auf 1024 768 Bildpunkte gesetzt SLUB AccessTools Microsoft Internet Explorer _ x Datei Bearbeiten Ansicht Favoriten Extras 2 OS a 3125 3 NM Zur ck Worwerts Aktualisieren Startseite Suchen Favoriten Verlauf E Mail Drucken Besteen Adresse 4 http 000102 slub dresden de hsss myhsss index jsp v wechseln zu Links A HochschulSchriftenServer der SLUB Dresden Fragen oder I ss SL Technische Probleme ETA AS UB Universitit Schicken Bi eine Dresden Email em TC News Volltext Feldsuche Navigation tr me J 1024 768 Feldsuche Feldsuche Hilfetext 4200 900 gt Titel u Titel muss Titel des Dokuments A Autor joachim OR udo OR alexander muss Alten Dokuments ibung i gt Beschreibung E EDAD Arbeit muss Beschreibung des Metadatensatzes Meine Treffer Schlagworte muss gt Schlagworte A Schlagworte die im Metadatensatz
174. en Zugriffsraten mit hoher Parallelit t zu einer deutlich bes seren Performance und Stabilit t f hrt im Vergleich zu Technologiealternativen die jeweils einen neuen Prozess erzeugen Innerhalb des Servlet Containers bernimmt das jeweilige Servlet der Teilanwendung die Kontrolle ber die Anfrage und nutzt die Java basierte Gesamtanwendung welche wiederum die Java Standard APT s aber auch eine Reihe zus tzlicher Bibliotheken nutzt In dieser Abbildung fehlt noch die Datenbankschicht auf die ebenfalls aus der Servletumgebung heraus ber die Java Anwendung mit Hilfe eines entsprechenden JDBC Treibers zugegriffen wird 3 3 2 1 Technologische Alternativen In der Belegarbeit wurden die technischen Alternativen zur eben vorgestellten Java basierten Infrastruktur ausgiebig analysiert und beschrieben Schb00l An dieser Stelle sollen deshalb die vorhandenen Alternativen nur kurz genannt und die wichtigsten Vor und Nachteile im Vergleich zur gew hlten Architektur zusammengefasst werden e Common Gateway Interface CGI Hierbei handelt es sich um die lteste und zur Zeit wohl noch verbreitetste Technologie um Webanwendungen zu realisieren CGI definiert eine Schnittstelle zwischen Webserver und externen Programmen die iiber diese Schnittstelle in den Prozess der Anfragebearbeitung mit einbezogen werden VORTEILE Nahezu jeder Webserver unterstiitzt diese Technik und nahezu jede Pro grammiersprache l sst sich ber CGI integrieren
175. en dann mit Hilfe der AdminTools in das System eingegeben und validiert 11 Anschlie end erfolgt wieder der Metadatenexport diesmal allerdings nur an den SWB S dwestdeutscher Biblio theksverbund 12 Dort wird ein MAB Datensatz Maschinelles Austauschformat f r Bibliotheken erstellt 13 welcher vom Referat 4 1 bzw 4 2 durch die rem Kennung als neuer Eintrag erkannt wird 14 Das Referat 4 1 4 2 meldet daraufhin das Vorhandensein an das Referat 5 3 welches den Datensatz noch einmal berpr ft Hochkatalogisieren 16 Als letztes wird der Metadatensatz durch die Adminis trationsanwendung in die persistente Datenbasisis des Systems eingestellt 17 Der 12 3 1 Gesch ftsmodelle und Arbeitsabl ufe Bericht ist dann weltweit und langfristig ber die entsprechend noch zu realisierende Webschnittstelle verf gbar Referat 5 3 Referate 10 11 AdminTools Referat 4 1 4 2 9 Ausdruck Prim r Metadaten 10 Sekund r Metadaten 11 Sekund re Metadaten pingeben validieren LU L 12 Metadatenexport K 0 Metadatenexport SWB 14 Abruf einer rem Meldung 13 Generiert AS pica 15 Meldung des Vorhandenseins eines MAB Datensatzes IR DEN des MAB Datensatzes 17 Endg ltiges Einstellen hes Metadatensatzes Abbildung 10 Sequenzdiagramm Gesch ftsgang f r Berichte Teil 2 3 1 3 Einsch tzung d
176. en der Realisierung der Anwendungsteile als Webanwendungen w ren nat rlich auch konventionelle clientseitige Anwendungen m glich Hier bestehen aller dinge einige schwere Nachteile die noch einmal kurz zusammengefasst werden sollen e Fine solche Anwendung ist wesentlich st rker von den technischen Gegebenheiten auf der Client Seite abh ngig e Die Anwendung muss erst auf dem entsprechenden Rechner installiert werden neben aller Software die sie m glicherweise zur Ausf hrung ben tigt Dieser Installationsvorgang ist in der Regel nicht trivial e Aktualisierungen sind bisher automatisch kaum m glich und daher extrem auf wendig zu realisieren e Verwendet man keine plattformunabh ngige Technologie muss man auch noch f r jede Plattform eine Portierung bereitstellen Selbstverst ndlich gibt es bei clientseitigen Anwendungen auch eine Reihe von Vortei len e Die Nutzerschnittstelle ist in der Regel wesentlich reichhaltiger und erlaubt di rektere und schnellere auch zuverl ssigere Reaktionen auf die Nutzereingaben da sie nicht von der Geschwindigkeit der Internetanbindung abh ngig ist 47 geschieht ber die Auslagerung der sich hinter den Tags befindlichen Logik in seperate Java Klassen und XML basierte Beschreibungsdateien 48Vielleicht mit Ausnahme von bestimmten Frameworks die die Umsetzung des MVC Paradigmas noch erleichtern sollen wie beispielsweise Struts L ST 111 3 Systemarchitektur e Di
177. en eine Ware bzw Dienstleistung sind oder aber ein ffentliches Gut Leider ist diese Grundsatzfrage bis heute auch politisch nicht endg ltig gekl rt Allerdings gibt es einige kaum zu bersehende Argumente f r wissenschaftliche Publika tionen als frei zug ngliches ffentliches Gut was keine Beeintr chtigung etwaiger Urheberrechte einschlie t und gegen das Modell eines beschr nkten kostenpflichtigen Zugangs der dann nur zahlenden Wissenseliten verf gbar w re und wo die zu gro en Teilen vom Steuerzahler finanzierte Wissenschaft sich ihre eigenen Produkte von der Wirtschaft zur ckkaufen m sste SiedOb 36 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld an sicH JGr000 Vergegenw rtigt man sich dass momentan gebr uchliche Datentr ger auch im geschichtlichen Vergleich ganz weit hinten liegen was deren Haltbarkeit betrifft wird deutlich in welchem Dilemma sich digitale Archive weltweit befinden siehe auch Tabelle 1 Medium HALTBARKEIT IN JAHREN gyptische Steintafeln min 2200 S urefreies Papier 100 bis 500 Microfilm 10 bis 500 CD ROM 5 bis 200 Magnetband 10 bis 30 Digitalband 10 bis 30 VHS Band 10 bis 30 Zeitungspapier 10 bis 20 Tabelle 1 Lebensdauer verschiedener Datentr ger Dabei ist das Problem gar nicht so sehr technischer Natur da nach Ansicht vieler Experten das Know How langlebige Datentr ger zu entwickeln l ngst vorhanden ist s
178. en und in ir gendeiner Art und Weise z Bsp in einer Hauptspeicherstruktur vorgehalten werden m ssen Mit zunehmender Gr e der Abbil dungsmenge nimmt die Perfor mance noch weiter ab h chst wahrscheinlich progressiv Flexibilit t Es ist zu einem Zeitpunkt immer nur die Verwendung einer Abbil dungsfunktion m glich nde rungen der Abbildungsfunktio nen beziehen sich ebenfalls auf alle Abbildungen Diese Alle oder Keiner Semantik schr nkt die Abbildungsflexibilit t stark eln Tabelle 11 Vor und Nachteile der Abbildungsans tze Obwohl der zweite Ansatz insgesamt praktikabler erscheint wurde im Rahmen der Diplomarbeit der erste Ansatz verfolgt Dies liegt insbesondere in den Entwurfsent scheidungen begriindet die zu diesem Zeitpunkt bereits getroffen waren vor allem im Zusammenhang mit der Bearbeitungsnumer siehe dazu Abschnitt 3 3 1 1Jauf Seite 92 und der Metadatenspezifikation So ware die Bearbeitungsnummer bereits sehr gut ge eignet um die Eindeutigkeit der absoluten URL in Bezug auf alle Metadatens tze des Systems zu garantieren In Hinsicht auf die Unterst tzung einer Abbildungsfunktion reicht sie jedoch h chstwarscheinlich nicht aus da sie au er dem Initialisierungszeit punkt keinerlei beabsichtigte inh rente Informationen tr gt Diese w ren aber f r 180 6 1 Realisierung einer absoluten URL eine praktikable Abbildungsfunktion notwendig Ohne lesbare kontextbas
179. enGenerator 4 1 Objektorientierte Analyse und Design 2 2 22 2 2 o AR 2 2 0 Bann Aa ne ee en 4 3 Persistenzrealisierung gt 22m onen EE E AI ee e Se ee 6 Pa ae bee het Eee EH IR A Br ne ed ee 5 Teilanwendung 2 AdminTools 5 1 Analyse und Design gt a a a0 ku sch 1 noeh ieh Se d 5 2 Realsierung a Aa 46 eur Ge ob ee ae De Se Ae See E a 5 2 2 Administrationsunterst tzung lt lt sen es 5 3 Persistenzrealisierung e 5S4 SCAU PEED s s a A A WO AAA A 6 Teilanwendung 3 HSSS AccessTools myHSSS 6 1 Realisierung einer absoluten URL edades 6 2 1 Die Volltextsuchmaschine Lucene 6 2 2 Integration von Lucene in die Anwendung 6 3 Realisierung ias sae AAA 6 4 Einsch tzung 2 2 a a en en 7 Implementierung des OAI Protokolls 7 1 Objektorientierte Analyse und Design e 1 2 Realisierung corredera re aueh AN ss s soros e rn eS en 0 Zusammenfassung und Ausblic 121 122 129 134 136 136 137 139 142 145 146 151 151 162 166 174 177 178 185 186 191 197 205 209 210 215 218 219 Inhaltsverzeichnis Sl Zusammenfassung e ed RE RRS AAA A 220 REN EE 222 ern ee 222 522 Verbessorungsm glichkeiten f r den Meladatenenerator 224 8 2 3 Verbesserungsm glic 8 2 4 Verbesserungsm glichkeiten f r die AccessTool myHSSS 226 BE li en a
180. endig was deutlich macht dass diese Funktion schnell zum Flaschenhals der gesamten Teilanwendung werden kann und deshalb besonders sorgf ltig realisiert werden muss Eine solche Indirektion ist notwendig um die langfristige Verf gbarkeit unter ei ner bestimmten sich nicht mehr ndernden absoluten URL garantieren zu k nnen Deshalb wird f r jede Ressource eine absolute URL erstellt wobei die Anwendung bzw das dahinterliegende System daf r garantieren muss dass diese sich nicht mehr ndert Selbstverst ndlich muss die absolute URL pro Ressource bzw Metadatensatz eindeutig sein Diese URL wird nun bei jeden Zugriff auf die momentan gerade g l tige reale URL abgebildet typischerweise auf eine wie auch immer konstruierte URL innerhalb des Dokumentenverzeichnisses eines Webservers Diese URL darf sich im Nachhinein ndern es muss lediglich die Abbildung von der absoluten auf die reale URL entsprechend angepasst werden was f r die Benutzer transparent bleibt Sie kennen nur eine sich nie mehr ver ndernde URL die sie daher auch zitieren oder als Lesezeichen benutzen k nnen Um die Abbildung zu realisieren bedarf es einer Indirektion die nur von einer entsprechenden Anwendung im Sinne von Software realisiert werden kann Die se Anwendung sollte sich nat rlich m glichst gut in das bestehende Gesamtsystem integrieren lassen so dass sich f r die bestehende Architektur eine Java basierte An wendung in Form eines Servlets oder e
181. enen Institutionen 18Leider verwendet DLmeta noch eine Document Type Definition DTD diese sollte in Zukunft durch ein XML SCHEMA abgel st werden da durch ein Schema wesentlich genauere Ein schr nkungen vor allem hinsichtlich korrekter Datentypen bzw Wertebereiche gemacht werden k nnen 48 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld auf ein Minimum reduzieren und die Etablierung von bergeordneten Protokollen f r dezentrale Archive wie z Bsp das OAI Protokoll wesentlich erleichtern Im anschlie enden Abschnitt wird noch einmal auf die Recherche bzw Retrieval eingegangen wobei der Fokus auf einer bergeordneten Metasuche ber mehreren de zentralen Archiven liegt Erstaunlicherweise wird in diesem Zusammenhang zwar kurz auf die Architektur der HARVEST Software eingegangen und sogar das CARMEN Projekt von Global Info erw hnt allerdings verliert das Dokument kein Wort zum OAI Protokoll oder zur Open Archives Initiative im Allgemeinerf Im Folgenden grei fen die Empfehlungen noch einmal sehr detailliert das Thema Sicherheitsaspekte auf Es wird darauf hingewiesen dass innerhalb des DFN Vereins damit begonnen wur de eine Public Key Infrastructure PKI speziell f r Universit ten und Hochschulen aufzubauen Ziel ist es dass jede Hochschule bzw Universit t eine eigene Zertifie rungsinstanz CA aufbaut so dass die Identit t jedes Nutzers bzw Computers durch ein digita
182. enenfalls einschr nken Die Aussagen des ersten Teils dieses Abschnitts beziehen sich auf die Anwendungen MetadatenGe nerator und AdminTools da diese auch in einem engen thematischen Zusammenhang stehen Der zweite Teil wird sich mit den AccessTools besch ftigen Integraler Bestandteil und Bezugspunkt der ersten beiden Anwendungen ist die Beschreibung eines Dokuments durch einen Metadatensatz in einem bestimmten Me tadatenformat F r den HSSS wird ein Metadatenformat nach dem Dublin Core Ele ment Set verwendet L DC Ein Metadatensatz in diesem Format besteht derzeit aus 15 Elementen Kategorien die jeweils durch Unterelemente Subelements verfeinert werden k nnen Dadurch entsteht eine streng hierarchische Struktur Eine Forderung an den HSSS war dass er m glichst XML f hig sein sollte zumindest aber sollte auf gezeigt werden an welchen Stellen der Einsatz dieser Technologie besonders sinnvoll 80 3 2 Architekturtibersicht ist Bei der Repr sentation von Metadatens tzen ist ein solcher Einsatz zum ersten Mal zu berdenken Zur Laufzeit wird ein Metadatensatz nat rlich durch eine Objekt Struktur im Hauptspeicher gebildet wie aber wird er tempor r zwischengespeichert In der Belegarbeit wurde die tempor re Persistenz durch Bord Mittel von Java in Form einer Ob jektserialisierung respektive deserialisierung realisiert Das hat einige Vor teild aber auch gravierende Nachteile so ist die Serialisierung stark v
183. enexport nach SWB zu realisieren D 2 12 JavaMail e Produktname JavaMail 282 D 2 Open Source Technologien Produkte Version 1 2 Homepage http java sun com products javamail index html Beschreibung Das JavaMail API stellt ein plattformunabh ngiges und protokollunabh ngiges Framework zur Realisierung javabasierter Mail und Messagingl sungen dar Einsatzbereich innerhalb des Gesamtsystems JavaMail wird in der gesamten Anwendung zum Versenden von Mails verwendet insbesondere in den AdminTools zur Realisierung des E Mail basierten Metada tenexports nach DDB 283 E Literaturverzeichnis und Linkverzeichnis 285 Literaturverzeichnis AABOO Bec00 BeM00 BMR98 Bog99 Bra99 BRJ99 Che01 Coo00 DDC99 DeP00 DINO1 Karl Avedal Danny Ayers Timothy Briggs and many others Professio nal JSP Wrox Press 2000 Kent Beck Extreme Programming Addison Wesley 2000 Henning Behme Steffen Mintert XML in der Praxis Addison Wesley 2000 2 Auflage Frank Buschmann Regine Meunier Hans Rohnert Peter Sommerlad Michael Stahl Pattern orientierte Softwarearchitektur Addison Wesley 1998 Marko Boger Java in verteilten Systemen dpunkt 1999 Jerry Bradenbaugh JavaScript Application Cookbook O Reilly 1999 Grady Booch Jim Rumbaugh Ivar Jacobson Das UML Benutzerhandbuch Addison Wesley 1999 Su Shing Chen The Par
184. ensatz Dokumenten Typ A 2 9 DC IDENTIFIER Bezeichnung STABILE DOKUMENT URL Beschreibung URL stabil ber die das eingestellte Dokument erreichbar ist DC Bezeichnung DC Identifier Virtual Parametername dc_identifier_ virtual Metadatentyp system Regulation mandatory H ufigkeit 1 1 Langenrestriktion 10 255 Tabelle A30 HSSS Metadatensatz stabile Dokument URL 239 A Metadatens tze des HSSS Bezeichnung REALE DOKUMENT URL Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion URL real ber die das eingestellte Dokument erreichbar ist DC Identifier Real dc_identifier_ real system mandatory 1 1 10 255 Tabelle A31 HSSS Metadatensatz reale Dokument URL A 2 10 DC FORMAT Bezeichnung HSSS FORMAT Beschreibung DC Bezeichnung Format e in dem denen die Dokumente vorgehalten werden DC Format Available Parametername dc _format_ available Metadatentyp system Regulation mandatory H ufigkeit 1 n L ngenrestriktion 3 100 Tabelle A32 HSSS Metadatensatz HSSS Format Bezeichnung ABGABE FORMATE Beschreibung Format e des an den HSSS bermittelten Dokumentes PDF PS DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion oder DVI DC Format Submitted de format submitted primary mandatory 1 3 3 100 Tabelle A33 HSSS Metadate
185. ent ist dabei eine Sammlung von zusammengeh rigen Informationen die in verschiedenen Feldern Field inner halb des Dokuments abgelegt werden k nnen Ein Feld ist ein Schl ssel Wert Paar bei dem der Wert aus einem String oder einem Reader bestehen kal Au erdem sind jedem Feld drei boolische Werte zugeordnet die dessen Nutzung beim Indizieren spezifizieren Der boolische Wert isIndexed signalisiert dass der Inhalt dieses Feldes bei Anfragen durchsucht wird isStored bedeutet dass der Inhalt des Feldes inner halb des Indexes gespeichert wird so dass eine vollst ndige Kopie des Feldes verf gbar 15Da ein Dokument aus einer Reihe solcher Schl ssel Wert Paare Felder besteht ist es genauge nommen eine besondere Hashtabelle 187 6 Teilanwendung 3 HSSS AccessTools myHSSS ist wenn das Dokument als Treffer zur ckgegeben wird und isTokenized gibt an ob der Inhalt des Feldes in einzelne Token aufgebrochen und jeweils einzeln indiziert wer den soll oder ob der Inhalt als ganzes indiziert und nicht in Token unterteilt wird Au erdem stellt Lucene ein spezielles Feld f r den Fall zur Verf gung dass ein Datum gespeichert und sp ter durchsucht werden soll Mit diesem Dokumentenmodell lassen sich Daten von beliebigen Quellen zu einem neuen Datenkonstrukt zusammenfassen das speziell der Volltextsuche dienen soll Die entstehenden Dokumente werden von Lucene in einer bestimmten optimierten Form in bin re Strukturen I
186. ent eingestellten Metadatens tze erstellt wird 165 5 Teilanwendung 2 AdminTools 5 3 Persistenzrealisierung Nachdem im Abschnitt 4 3 auf Seite 134 bereits die zu diesem Zeitpunkt genutzten Tei le des Datenbank Schemas vorgestellt wurden welche allerdings nur sehr flach struktu riert waren wird in diesem Abschnitt das Design des eigentlichen f r die eingestell ten Metadatens tze verwendeten Datenbank Schemas vorgestellt Das zu spezifizieren de Schema soll dabei alle gemeinhin blichen Datenbankschema Eigenschaften HeS00 erreichen insbesondere sollen 1 alle Anwendungsdaten aus den Basisrelationen hergeleitet werden k nnen 2 nur semantisch sinnvolle und konsistente Anwendungsdaten dargestellt werden k nnen 3 die Anwendungsdaten m glichst nicht redundant dargestellt werden Aus dem ersten Punkt ergibt sich im vorliegenden Fall die Forderung dass das Schema alle zu einem Metadatensatz geh renden Metadaten ber cksichtigt und diese somit auch wieder hergeleitet werden k nnen Das bedeutet dass alle in der Metadaten spezifikation der jeweiligen Dokumentenart definierten Elemente bzw Subelemente in der Datenbank in einer noch zu bestimmenden Form gespeichert werden Der zweite Punkt der semantisch sinnvolle und konsistente Anwendungsdaten verlangt wird zum Teil bereits durch die Arbeitsabl ufe realisiert deren Ziel es ja gerade ist hochwertige syntaktisch und semantisch korrekte Metadate
187. entierte Analyse und Design ag CG DD 4 CD D E Go HM A HH HH ou E oh rz KFA RRR kk bk oo oo oo o WWW WM HMR HHH NND KH 0 3D ob ob Go OG AG Dk ona Oo A Oo E o Ho Oo 0 ublic SortedSet getPageSet SortedSet result new TreeSet if isPageCached int ende Math min getStart getCount getLength for int i getStart i lt ende i try Hit h Hit results get new Integer i result add h catch Exception ex Debug logError this ex else int ende Math min getStart getCount getLength for int i getStart i lt ende i try int score new Float hits score i 100 intValue int number i 1 Hit hit new Hit number score hits doc i get identifier hit setAuthor getAuthor hits doc i get creator hit set Date DateField stringToDate hits doc i get date hit setOriginalTitle getOriginalTitle hits doc i get title hit set Type hits doc i get type if detailed hit setTitle getTitle hits doc i get title hit set Description getDescription hits doc i get description result add hit results put mew Integer i hit catch Exception ex Debug logError this ex return result Listing 10 Realisierung des Pagings Andernfalls m ssen f r die entsprechenden Treffer neue Hit Objekte erstellt wer den ab Zeile 28 Die daf r notwendigen Informationen werden aus dem Hits Objekt
188. entifier verringert die Ergebnis menge auf das Metadatenformat f r einen bestimmten Record e ListRecords Diese Anfrage wird genutzt um Records eines Repository zu erhalten Der ob ligatorische Parameter metadataPrefix bezeichnet das gew nschte Metadaten format optionale Parameter k nnen die Ergebnismenge nach verschiedenen Kri terien einschr nken e ListSets Diese Anfrage wird genutzt um eine Set Struktur eines Repository zu erhalten Zusammenfassend l sst sich sagen dass das OAI Protokoll in seiner jetzigen Form ein schlankes leicht zu implementierendes Protokoll ist welches sich aufgrund dieser l4Wie bereits gezeigt wird jede OAI Anfrage ber das HTTP Protokoll verschickt indem bestimmte Schliissel Wert Paare bergeben werden z Bsp der Parameter verb f r die Bezeichnung der OAI Anfrage 43 2 Aufgabenstellung Grundlagen Arbeitsabl ufe Tatsachen und der Nutzung von HTTP als Tr gerprotokoll weiter verbreiten sollte als die vorher angesprochenen Alternativen Ein Vorteil dieses Protokolls ist sicherlich auch dass die Anforderungen an beteiligte Archive relativ gering sind eigentlich ist lediglich die Beschreibung der Inhalte durch das Dublin Core Metadatenformat zwin gend vorgeschrieben F r die Zukunft w re es w nschenswert das Protokoll komplett XML basiert zu gestalter und eine moderne Referenz Implementation z Bsp in Form eines Servlets anzubieten 2 4 2 Deutsche Initiative f r
189. ents zur Verf gung stellen Mit diesem Anwendungsfall steht neben dem Referat 5 3 wobei Dissertation hier und im Folgenden im Sinne der Dokumentenart Dissertation gemeint ist so dass es sich jeweils um eine Dissertation oder eine Habilitation handeln kann 64 3 1 Gesch ftsmodelle und Arbeitsabl ufe auch das Referat 3 4 in Verbindung Abbildung 3 zeigt das dazugeh rige Sequenz diagramm welches die beschriebenen Sachverhalte noch detaillierter darstellen kann insbesondere was deren zeitliche Reihenfolge betrifft 2 Referat 5 3 Referat 3 4 Autor 1 MG nutzen 4 Abgabe der Druckexemplare el Version IS d EN Metadaten 7 siehe Sequenzdiagr soga 5 3 8 Best tigung Abbildung 3 Sequenzdiagramm Gesch ftsgang in Bezug auf den Autor 6 OK Meldung Fehlermeldung Die Abbildung zeigt den Akteur Autor und die f r ihn sichtbaren Instanzen Objekte des Systems sowie die zeitliche Reihenfolge aller Nachrichten zwischen die sen Objekten Als erstes 1 nutzt der Autor die vom System zur Verf gung gestellte Schnittstelle zur bermittlung der Metadaten Bei dieser Schnittstelle handelt es sich um die im Diplom noch leicht zu modifizierende Version der im Rahmen der Belegarbeit entstandenen Anwendung MetadatenGenerator Das Verb nutzen steht dabei f r eine Reihe von Interaktionen die der Autor mit dieser Anwendung vornehmen muss eine genauere Spezifikation dieser
190. enzrealisierung nicht zwischen verschiedenen Datenbanksystemen austauschbar sind Im Zuge der zunehmenden Unterstiitzung des SQL99 Standards durch die meisten modernen Da tenbanksysteme ist hier aber Abhilfe in Sicht insbesondere auch durch die M glichkeit gespeicherte Prozeduren in einer plattformunabh ngigen Sprache wie Java zu formu lierer2 32Hier sollte man die M glichkeiten des Sybase Adaptive Server Enterprise 12 5 in diesem Zusam menhang ausloten und die gespeicherten Prozeduren gegebenenfalls in Java neu formulieren 173 5 Teilanwendung 2 AdminTools 5 4 Einsch tzung Bei der Teilanwendung Admin Tools handelt es sich um die umfangreichste und bei wei tem komplexeste Teilanwendung innerhalb des Gesamtsystems Obwohl bereits Ans t ze durch die Belegarbeit vorhanden waren mussten hier im Rahmen der Diplomarbeit erhebliche Investitionen unternommen werden Die besondere Schwierigkeit bestand dabei darin die in Abschnitt ab Seite 62 spezifizierten Arbeitsabl ufe effektiv zu unterst tzen weil sich diese ber viele beteiligte interne und externe Institutionen er strecken So gab es viele unterschiedlichste Anforderungen an Technologien Formate und Protokolle die nur durch die Integration leistungsf higer externer Programmier schnittstellen API s und Bibliotheken unterst tzt werden konnten Die Auswahl sol cher APT s deren Verst ndnis sowie die Anpassung und Integration in das bestehende Gesam
191. er Arbeitsabl ufe Im Rahmen des Diploms konnte f r beide Dokumentenarten ein stimmiges und im Ver gleich zu der fr heren Vorgehensweise sehr geordnetes Gesch ftsmodell entwickelt wer den Von fundamentaler Bedeutung war es das f r elektronische Hochschulschriften haupts chlich zust ndige Referat 5 3 in alle mit dem HSSS verbundenen Arbeitsg nge zu involvieren so dass die komplexen Abl ufe von dieser Stelle aus zentral koordiniert werden k nnen ohne aber die Kompetenz anderer Referate zu beschneiden Besonders 13 3 Systemarchitektur intensiv war dies f r das Gesch ftsmodell der Dokumentenart Dissertation von N ten da hier die Zahl der beteiligten internen und externen Instanzen besonders hoch ist Beide Gesch ftsmodelle wurden mit allen beteiligten Referaten bzw Institutionen be sprochen und so weit m glich auf die jeweiligen Verh ltnisse respektive Bed rfnisse abgestimmt Zusammenfassend l sst sich sagen dass mit den beiden hier vorgestellten Gesch ftsmodellen und den damit verbundenen Arbeitsabl ufen eine Systemorgani sation gefunden wurde die als Ausgangspunkt f r die weiteren Entwicklungen im Rahmen der Diplomarbeit ausgezeichnet geeignet ist und auch mittelfristig f r die Beschreibung aller notwendigen den Hochschulschriftenserver der SLUB betreffenden Aktionen ausreichen sollte Nat rlich gibt es in beiden Gesch ftsmodellen noch Verbesserungspotenzial Ein erster Kritikpunkt betrifft die bermittlu
192. er Funktionalit t eines Hochschulschriftenservers realisiert und aufgrund der Kombination von Java und XML an Plattformunabh ngigkeit kaum zu bertreffen sein d rfte Insofern w re sie ideal geeignet f r beliebige Institutionen als Plug and Play L sung zu dienen die an einer technisch fortgeschrittenen und vor allem flexibel konfigurierbaren L sung interes siert sind Eine solche Anwendung w rde sich nat rlich ideal als Referenzimplementierung f r eine Orgaisation eignen welche die nationale Koordinierung von elektronischer Publizistik im Wissenschaftsbereich bernimmt so wie sie in Abschnitt 2 4 4 auf Seite 56 gefordert wurde 30 89 3 Systemarchitektur den Nutzer bestimmbare Skalierung der Aufl sung der Web Schnittstelle verlangt soll allerdings vollst ndig unterst tzt werden Probleme k nnten sich vor allem durch die ebenfalls notwendige Skalierung von Grafiken in Verbindung mit der schlechten Unterst tzung von vektorbasierten Formaten ergeben gegebenenfalls muss hier die dynamische Skalierung auf eine Skalierung f r eine begrenzte Zahl von vorgegebenen Aufl sungen reduziert werden Die vierte Vision die eine Portal basierte und stark personalisierte Umsetzung der dritten Teilanwendung verlangt wird aufgrund der sich daraus ergebenen hohen Entwicklungskosten nur teilweise umgesetzt werden k nnen Insbesondere die persistente Registrierung unter Nutzung der Datenbank wird einer sp teren Ausbaustufe vo
193. er Metadatensatz im finalen Metadatenstatus Validierung Sekund rmetadaten OK Der Metadatensatz ist also vollst ndig und kann damit bereits an die externen Institutionen SWB und DDB exportiert werden Dazu klickt der Nutzer im zentralen bersichtsbereich f r den entsprechenden Me tadatensatz auf Export DDB bzw Export SWB Im ersten Fall erscheint ein Formular wie das in Abbildung 44 gezeigtd ep ddb de L60000589 hs Bergmann Rainer 17 Abbildung 44 HSSS AdminTools Export nach DDB Da der Metadatenexport nach DDB E Mail basiert verl uft ist in der Abbildung ein typisches E Mail Formular zu sehen welches von den AdminTools dynamisch er stellt wird Die Zieladresse ist bereits eingetragen sie wird aus der Konfigurations struktur hsssdata xml gewonnen siehe auch Abschnitt B 1 Der Betreff wird eben falls dynamisch generiert und entspricht einem von der DDB vorgegebenen Format Optional kann der Nutzer nun noch eine Nachricht hinzuf gen Die eigentlichen Export Daten befinden sich aber in einer HTML Datei die der E Mail als Anhang 2W rde diese Aktion f r einen Metadatensatz get tigt werden dessen Metadaten Zustand noch nicht Validierung Sekund rmetadaten OK entspricht w re der Button Absenden gesperrt weil ein Export in diesem Stadium auch noch keinen Sinn machen w rde 156 5 2 Realisierung beizuf gen ist Diese Datei wurde von der Anwendung ebenfalls komplett automati s
194. er xxx eingetragen so SLUB Datum von bis werden alle verf gbaren Datens tze angezeigt TUDresden Felder und Volltext durchsucht sowohl den Volltext als auch die Felder nach dem eingegebenen Suchbegriff Wird der Platzhalter xxx eingetragen so werden alle verf gbaren Datens tze angezeigt gt detailierter Report Erm glicht Anzeige detailierter Informationen zum Datensatz gt Ergebnisgr e Grenzt die Anzahl der zu zeigenden Datens tze je Seite ein gt Datum Grenzt den Ver ffentlichungszeitraum ein E Fertig Internet Abbildung 56 myHSSS Volltextsuche in der Aufl sung 800 600 Im oberen Teil befinden sich einige Grafiken die auf die beteiligten Institutionen verweisen sowie die integrierte Suche von Fireball Wissen Da es sich gerade bei dieser dritten Teilanwendung um eine prototypische Implementierung handelt sind die Inhalte sp ter zu ersetzen bzw zu erg nzen Links darunter findet sich eine ver tikale Leiste mit einigen Verweisen Grafiken und Buttons darunter auch diejenigen 197 6 Teilanwendung 3 HSSS AccessTools myHSSS welche die Wahl von verschiedenen Skalierungen Aufl sungen erm glichen Daneben befindet sich ein relativ gro er Bereich der f r die eigentlichen Benutzerschnittstellen reserviert ist z Bsp Volltextsuche Feldsuche etc dar ber eine horizontale Leiste mit den verschieden
195. erden Zun chst w rde die Anwendung bei einem Klicken auf Ausf hren versuchen aus dem elektronischen Dokument im Pr sentationsformat automatisch den Volltext zu extrahieren Da das Ergebnis von unterschiedlicher Qualit t sein kann wird es in einem folgenden Fenster dem Nutzer pr sentiert So kann dieser entscheiden ob der erstellte Volltext den bestehenden Anspr chen gen gt In diesem Fall w rde er den Vorgang des Einstellens fortset zen Im anderen Fall besteht die M glichkeit den Vorgang vorerst abzubrechen um 159 5 Teilanwendung 2 AdminTools zum Beispiel durch die Verwendung anderer Werkzeuge au erhalb der Anwendung zu einem besseren Ergebnis zu gelangen Der n chste Teilschritt besteht im Kopieren des Dokuments in ein entsprechendes Verzeichnis auf dem Webserver und kann auch wieder wahlweise bersprungen werden Der jeweilige Verzeichnispfad wird aus den Metadaten automatisch in einer bestimmten Form relativ zum Wurzelverzeichnis des Webservers generiert F r das betrachtete Beispiel w rde der Verzeichnispfad lt webserver root dissertation 2000 wirtschaftswissenschaften 994407959125 9687 lauten Das Verzeichnis setzt sich also aus der Dokumentenart dem Ver ffentlichungs jahr der Fakult t und der Bearbeitungsnummer des jeweiligen Metadatensatzes zu sammen In dieses Verzeichnis wird das Dokument unter dem Namen lt Bearbeitungs nummer gt lt Erweiterung des Pr sentationsformats gt kopiert
196. erden von der OAI Implementierung des HSSS unterst tzt Die notwendigen Daten zur Definition der Sets wurden dabei XML basiert in der Konfigurationsstruktur oaisets xml realisiert was den gro en Vorteil hat dass sie ohne Eingriff in den Quelltext der Protokoll Implementation beispielsweise von den Mitarbeitern des Referats 5 3 nderbar sind Details zu der Konfigurationsstruktur oaisets xml finden sich im Anhang in Abschnitt B Diese XML Struktur wird bei der Initialisierung vom OAIServlet eingelesen geparst und in einer Datenstruktur abgelegt die eine hierarchische Menge von Objekten des Typs DAISet enth lt Eine weitere optionale Anforderung des OAI Protokolls ist die Unterst tzung von sogenannten Resumtion Token Dabei handelt es sich um einen eindeutigen Wieder aufnahmezeiger der zusammen mit einer Teilergebnismenge auf eine Anfrage zur ck geschickt wird die eine Ergebnismenge oberhalb eines zu definiernden Schwellwertes erzeugt Diese Schwellwerte k nnen im Falle der OAI Implementation des HSSS von au en ber die XML Datei web xml und dar berhinaus auch f r unterschiedliche Be fehld eingestellt werden Die besondere Schwierigkeit besteht aufgrund der Zustands losigkeit von HTTP darin Wiederaufnahmezeiger Datens tze und Anfragen korrekt Diese M glichkeit ist aufgrund der Konzeption des OAI Protokolls und seiner Befehle insbesondere bei gro en Archiven sehr sinnvoll So liefert der OAI Befehl ListRecords
197. eren Teilanwendungen dienen kann Auch der Umfang der realisierten Such bzw Navigationsm glichkeiten ist angemessen und entspricht dem g ngiger Suchmaschinen Insbesondere die Realisierung der Suchen und die Pr sentation von Ergebnissen sowie die Unterst tzung von Teilergebnissen Seiten und deren Verwaltung kann schon in dieser prototypischen Version berzeugen Die Ver wendung von Lucene hat sich bis jetzt wirklich ausgezahlt eine direkte Realisierung der Suchen innerhalb der Datenbank w re bedeutend aufwendiger und mit Sicherheit weniger performant gewesen Die Geschwindigkeit der Suchen ist subjektiv sehr hoch hier sollten allerdings noch Messungen bei massiv parallelem Zugriff und bei gr eren Datenmengen vorgenommen werde Die vierte Architekturvision konnte nur in Ans tzen realisiert werden was aller dings bereits in Abschnitt diskutiert und erwartet wurde Immerhin wurde ein auf ein Portal ausgerichtetes prototypisches Design f r die Benutzeroberfl che my HSSS realisiert welches freilich einige inhaltliche L cken aufweist die im Rahmen der Weiterentwicklung des HSSS zu schlie en sind Ans tze f r m gliche Dienste wur den mit der M glichkeit aufgezeigt Treffer beliebiger Suchen innerhalb einer Sitzung zu sammeln Solche und viele weitere Dienste insbesondere Personalisierungen lie en sich bei einer Erweiterung der dritten Teilanwendung auf persistente Registrierung etc leicht realisieren Zusammenfassend l sst si
198. erfolgung sowie de Kommunal und Landesverwaltungen die Denkmalkultur Im Zuge der fortschreitenden Institutionalisierung wurden die ehemaligen Verfolgten in beiden Staaten zunehmend von der erinnerungspolitischen B hne verdr ngt Die Inanspruchnahme der Erinnerungskultur f r politische Interessen der Staats und Parteif hrung der DDR setzte 1953 ein und konzentrierte sich auf die Standorte ehemaliger Konzentrationslager Auf regionaler und kommunaler Ebene besa en die Akteure der Denkmalsetzung eingebunden in die restriktiven Vorgaben der SED Politik etwas gr ere Handlungsspielr ume In der BRD wo die Denkmalgestaltung als kulturelle Aufgabe vollkommen in der Verantwortung der L nder lag wurde sie zu einer Verwaltungsangelegenheit bzw dem Volksbund Deutsche Kriegsgr berf rsorge bertragen Vor dem Hintergrund dieser unterschiedlichen Voraussetzungen waren sich die Denkmalanlagen in beiden deutschen Staaten dennoch in vieler Hinsicht formal hnlich In der memorialen Gestaltung herrschten sl ei Fertig e Intemet Z Abbildung 53 HSSS Frontdoor Auch wenn der gew hlte Abbildungsansatz mittelfristig f r den HSSS ausreichen wird sollte er im Rahmen weiterer Ausbaustufen kritisch hinterfragt werden Zumin dest w re eine Messung des Verhaltens der beiden Ans tze in den Punkten Stabilit t und Performance bei verschiedenen auch sehr gro en Abbildungsmengen sinnvoll um zu zeigen wie gro die vermuteten Unterschiede zugunste
199. erprise e Version 12 0 e Homepage http www sybase com e Beschreibung Bei dem Sybase Adaptive Server Enterprise ASE handelt es sich um ein rela tionales Datenbanksystem RDBMS Dabei unterst tzt der ASE insbesondere Transaktions intensive Anwendungen und Hochverf gbarkeitsl sungen und wird daher oft in OLTP Anwendungen verwendet e Einsatzbereich innerhalb des Gesamtsystems Der Datenbankserver wird ohne zus tzliche Module wie etwa Volltextsucherwei terung oder Java Option betrieben und dient zur persistenten Speicherung der Metadatens tze und anderen Systeminformationen Als JDBC Treiber dient der Sybase eigene Treiber JConnect in der Version 5 2 276 D 2 Open Source Technologien Produkte D 2 Open Source Technologien Produkte D 2 1 JSDK e Produktname Java Standard Development Kit JSDK e Version 1 3 e Homepage http java sun com e Beschreibung Bei dem Java Standard Development Kit handelt es sich um eine komplette Programiersprachenumgebung mit allen notwendigen Werkzeugen z Bsp Com piler Interpreter etc Basisklassen und erweiterten API s Bibliotheken Alle Klassen dieses Systems sind auch im Quelltext verf gbar e Einsatzbereich innerhalb des Gesamtsystems Die gesamte Anwendung basiert auf den Klassen und Bibliotheken des JSDK in der Version 1 3 bzw wurde mit dessen Hilfe realisiert D 2 2 Apache e Produktname Apache Webserver e Version 1 3
200. ervers f r Hochschulschriften und das Angebot der damit verbundenen Dienste stellt einen guten Einstieg in diese Materie dar der von einigen Institutionen auch bereits gewagt wurde In Deutschland gab es eine Reihe von Projekten die sich mit dieser Problematik auseinandersetzten und die Grundlagen schufen auf welchen heute jede Bibliothek aufbauen kann Auch der Gro teil an technischen Grundsatzfragen ist heutzutage bereits gekl rt so dass es jetzt vor allem auf den Willen der Bibliotheken ankommt in ihre Zukunft zu investieren und nat rlich auch darauf dass die Bibliotheken bei dieser Herausforderung entsprechend unterst tzt werde Allerdings gibt es auch eine Reihe technischer Detailfragen die zwar seit Jahren bekannt sind und rege diskutiert werden die jedoch noch l ngst nicht zufriedenstellend gel st sind Dazu geh rt das gro e Problemfeld der physischen Langzeitsicherung di gitaler Daten Che01 Vor allem gibt die geringe Haltbarkeit bisheriger und derzeitiger Datentr ger zu denken zum einen was die Haltbarkeit der auf ihnen gespeicherten Daten angeht zum anderen aber auch ihre technologische Relevanz und Verbreitung unter anderem Dissertationen Online DFG Projekt 1998 2000 Networked European Deposit Library NEDLIB Europ ische Kommission 1998 2000 6Diese Aufgabe kommt vor allem Bund und L ndern zu Von fundamentaler Bedeutung ist dabei die Grundsatzfrage ob wissenschaftliche Ver ffentlichung
201. es die im Abschnitt der Client Ebene besprochen werden strenggenommen auch zu den Server seitigen Anwendungen Da die Gesamtanwen dung aber konsequent das Model View Controller Paradigma f r Web Anwendungen realisiert siehe Sie00bl und die JSP s f r den View Bereich verantwortlich sind der wiederum die Schnittstelle des Clients definiert ist diese Einteilung vertretbar Zu s tzlich werden in dem sich anschlie enden Abschnitt noch einige Besonderheiten der Architektur betrachtet wie zum Beispiel die Konfigurationsstrukturen der Gesamtan wendung 31 Auch die Architekturdetails beziehen sich auf die gesamte Anwendung die allerdings nach gewis sen Gesichtspunkten unterteilt wird Architekturdetails der einzelnen Teilanwendungen werden hingegen in den folgenden Kapiteln beschrieben 32Da JSP s nicht anderes als eine besondere Form eines Servlets sind 91 3 Systemarchitektur 3 3 1 Architekturbesonderheiten In diesem Abschnitt sollen einige Architekturbesonderheiten vorgestellt werden wel che die gesamte Anwendung betreffen und deren Kenntnis f r das Verst ndnis der im weiteren Verlauf der Diplomarbeit gezeigten Entwurfsentscheidungen von Vorteil ist Dabei handelt es sich zum einen um den Algorithmus zur Erstellung einer eindeutigen Bearbeitungsnummer f r die Metadatens tze und um die Vorstellung der verschie denen Konfigurationsstrukturen durch die die Anwendung von au en weitestgehend konfigurierbar ist
202. es Archivs bzw des Repository und aus Nutzungshinweisen OAI Protokoll Anfragen werden in HTTP Anfragen eingebettet Dadurch kann eine Implementation dieses Protokolls normale Standardsoftware benutzen zum Bei spiel einen Webserver wie Apache der so konfiguriert ist dass er OAI Anfragen an eine Anwendung weiterleitet die diese Anfragen verarbeiten kand Grunds tzlich beste 12Zum Beispiel ein Perl Script ber CGI oder ein PHP Script besser eine plattformunabh ngige Alternative wie etwa ein Servlet 41 2 Aufgabenstellung Grundlagen Arbeitsabl ufe hen OAI Anfragen genau wie HTTP Anfragen auch aus einer Ziel URL und einer Reihe von Schl ssel Wert Paaren Parametern Zum Beispiel beschreibt die folgende OAI Protokoll Anfrage http hsss slub dresden de hsss servlet hsss oai 0AIServlet verb GetRecord _ amp identifier oai hsss 99010018976 5678 amp metadataPrefix oai_dc eine GetRecord Anfrage an die URL hsss slub dresden de hsss servlet hsss oai OAIServlet Anwendung des Repository Als Parameter werden in Form von Schl ssel Wert Paaren zum einen die Art der Anfrage GetRecord sowie der Identifier des gesuchten Elementes bergeben zus tzlich das Metadaten Prefix des Metadatenfor mates Die Einbettung von OAI Anfragen ist sowohl in HTTP GET Anfragen wie gezeigt als auch in HTTP POST Anfragen m glich OAI Protokoll Antworten werden als HTTP Antworten versendet und haben da her deren
203. es Suche he RNA bindenden Proteinen liegt verst rken sich die Hinweise zur Beteiligung von Cbslp an der direkten na uch z B Waldb ist physikalischen Wechselwirkung mit dem 5 leader der COB mRNA Dar ber hinaus konnte gezeigt Be werden dass die abspaltbare Pr sequenz nicht notwendig f r einen bersicht A llews 2 Dissertation Nanostruktur ionenbestrahlter Fe Al und Co Cu Grenzschichten ns S S extsuc 19 Autor Joachim Noetzel Dipl Phys Volltextsuche ber den Bestand des A Datum 16 09 2000 HSSS a it gt Faldeucha d ei 8D Internet Abbildung 60 myHSSS gesammelte Treffer Hier werden alle gesammelten Treffer in einer hnlichen Form wie bei den verschie denen Suchen pr sentiert Zu beachten ist dabei dass sie zur besseren bersicht in der 201 6 Teilanwendung 3 HSSS AccessTools myHSSS Reihenfolge angezeigt werden in der sie vom Nutzer gesammelt wurden Anhand der absoluten URL eines Treffers sind Treffer von der Anwendung eindeutig unterscheid bar so dass kein Treffer mehrfach aufgef hrt wird was schnell passieren k nnte wenn ein Nutzer in verschiedenen Suchen denselben Treffer erh lt und ihn mehrmals zum Sammeln anklickt Allerdings w rde sich ein solcher mehrfach gew hlter Treffer bei jedem neuen Klick in seiner Positionierung innerhalb der Trefferliste ver ndern Diese zeitliche Positionierung wird durch die in Abschnitt vorgestel
204. estehende OAI Implementation zu testen und zeigt die Reaktion auf die m glichen OAI Befehle lib vt edu oai cgi bin E xplorer oail 0 testoai gt Abbildung 64 OAI Repository Explorer Anzeige eines Records Die Abbildung zeigt die Repr sentation eines Records als erstes werden die In formationen identifier und datestamp angezeigt die aus dem Header der Proto kollantwort stammen Anschlie end folgt ein Metadaten Abschnitt der den Record inhaltlich beschreibt Hier wurde die XML Struktur der Antwort bereits in eine etwas leserlichere HTML Struktur umgesetzt Das verwendete Metadatenformat ist Dublin Core und die einzelnen Kategorien sind von dem Repository Explorer bereits in der Form DC Kategorie hevorgehoben au erdem wurde der Verweis auf die absolute URL des Records bereits entsprechend verlinkt so dass ein Klick zur entsprechenden Frontdoor f hren w rde Au erdem wurden von den Mitarbeitern des Referats 5 3 die notwendigen Informa tionsseiten f r das OAL Repository vorbereitet Dazu z hlen Seiten mit Informationen zu den rechtlichen Bedingungen im Umgang mit den Metadaten bzw mit den ei gentlichen Dokumenten und allgemeine Informationsseiten mit Inhaltsbeschreibungen 216 7 2 Realisierung Abbildung 65 zeigt die zentrale OAI Informationsseite des HSSS welche u a eine Inhaltsbeschreibung des Archivs in englisch und deutsch enth lt 3 HSSS Document Server at SLUB Dresden Germany
205. etadataManager erlaubt die Behandlung von tempor ren Metadatens tzen Speichern Lesen L schen ndern R cksetzen etc durch die Anwendung Beide Klassen k nnen jeweils f r bestimmte Datenbanken spezialisiert werden 5580 z Bsp ob Connection Pooling verwendet werden soll und mit welchen Parametern Poolgr en Cachegr en etc 56Das ACID Prinzip von Transaktionen Atomicity Consistency Isolation Durability 119 4 Teilanwendung 1 MetadatenGenerator Inhalt des Kapitels SICHERTE 122 4 2 Realisierung s see a 2 2 022 sw a eee e 129 4 3 Persistenzrealisierungl ewes 134 A E 136 4 4 1 Evaluation 136 4 4 2 Status Verfolgung durch den Autor 137 ae 139 4 5 Einsch tz ng 22 522 a Eer 142 121 4 Teilanwendung 1 MetadatenGenerator 4 1 Objektorientierte Analyse und Design In diesem Abschnitt sollen spezielle Aspekte der objektorientierten Analyse und des Designs die sich auf die Teilanwendung MetadatenGenerator beziehen n her erl u tert werden Obwohl diese Teilanwendung im Rahmen des Gro en Belegs bereits umfassend und zufriedenstellend implementiert werden konnte ist sie im Verlauf der Diplomarbeit nahezu vollst ndig neu implementiert worden freilich unter Nutzung und bernahme der positiven Eigenschaften sowie des Layouts aus dem Beleg Die Gr nde ergaben sich vor allem aus den in der Aufgabenstellung und in den Archi
206. etadatens tzen Diese Tabelle enth lt Zuordnungen von Relationen zu Meta datens tzen und deren Typ interne Relationen externe Rela tionen Diese Tabelle enth lt Zuordnungen von Schlagworten bzw Klassifikationen zu Metadatens tzen und deren Typ eigene Schlagworte deutsch englisch Klassifikationen DNB RVK Schlagworte nach SWD Diese Tabelle enth lt Zuordnungen von Titeln zu Metadaten s tzen und deren Typ Originaltitel alternative Titel ber setze Titel Tabelle A57 Tabellen bersicht Teil 2 262 C 1 berblick gespeicherte Prozedur BESCHREIBUNG insert_type insert_language insert_publisher insert_contributor insert_rights insert_date insert_person insert_subject insert_title insert_format insert_relation insert_publication insert_metadataset delete_metadatset max_metadataset urlmapping lucene_fields_metadataset lucene_fields_fulltext lucene_fields_title lucene_fields_subject lucene_fields_description lucene_fields_creator lucene_fields_advisor lucene_fields_referee lucene_fields_date lucene_fields_type wird verwendet beim Einstellen der Metadaten liefert id des Dokumententyps und erstellt ihn gegebenenfalls wird verwendet beim Einstellen der Metadaten liefert id der Sprache und erstellt sie gegebenenfalls wird verwendet beim Einstellen der Metadaten liefert id des Ver ffentlichers und erstellt ihn gegebenenfalls wird
207. etzungen ergeben sich eine Reihe von interessanten Dienstleistungen die den potentiellen Nutzern angeboten werden k nnen Einige dieser M glichkeiten wurden in Abschnitt 6 4 angedeutet 2Der explizite Abbildungsansatz sollte f r Datenmengen im Bereich von 1000 bis 10000 Hochschul schriften ausreichen 226 8 3 Ausblick 8 3 Ausblick Im Verlauf dieser Diplomarbeit konnte f r die SLUB ein rundes System erstellt wer den das allen prim ren Anforderungen an einen Hochschulschriftenserver gerecht wird und dar ber hinaus sehr interessante Ideen andeutet oder sogar umsetzt Au erdem wurde es auf der Basis von modernen zukunftstr chtigen Technologien und zudem unschlagbar preiswert entwickelt Dadurch bietet das bestehende System ideale Vor aussetzungen f r die Entwicklung und das Betreiben einer Produktivversion des HSSS Denn das System in seiner derzeitigen Form ist kein Produktivsystem im Sinne einer Anwendung die einmal installiert f r die n chsten Jahre ihren Dienst tut Obwohl der Autor sich redliche M he gegeben hat eine stabile Anwendung zu realisieren und durch regelm ige Tests die Zahl der Fehler zu minimieren ist sicher einsichtig dass eine Anwendung dieser Komplexit t die in wenigen Monaten entstanden ist nicht die Erf llung der harten Anforderungen einer Produktivversior garantieren kann Die Anwendung kann auch nicht alle Eventualit ten vorhersehen die sich m gli cherweise in den n chsten M
208. falls m ssen die Suchvorg nge durch die Anwen dung direkt auf der Datenbank vorgenommen werden In diesem Fall ist schon beim Design der Datenbank Schemata darauf zu achten entsprechende Optimierungen vor zunehmen Eine dritte M glichkeit besteht in der Integration einer externen Volltext Suchmaschine Die Navigation l sst sich wahrscheinlich am besten mit direktem Zugriff auf die Datenbank realisieren Falls zeitlich m glich w re eine Messung und Auswer tung des Antwortzeitverhaltens der dritten Teilanwendung bei gro en Datenmengen bzw vielen Zugriffen interessant ebenso die Qualit t der Suche 32 2 3 R ckblick auf den Gro en Beleg 2 3 R ckblick auf den Gro en Beleg Im Rahmen einer Belegarbeit Schb00 wurden bereits wichtige Grundlagen erarbeitet und Ergebnisse und Erkenntnisse erzielt auf die sich die Diplomarbeit vielfach be ziehen kann und wird Dieser Abschnitt soll sich mit den Anforderungen und den wichtigsten Ergebnissen der Belegarbeit besch ftigen insbesondere im Hinblick auf deren Relevanz und Nutzbarkeit f r die Diplomarbeit Au erdem sollen die Ergebnis se kritisch hinterfragt und auf im Diplom realisierbare Verbesserungsm glichkeiten hin untersucht werden 2 3 1 Anforderungen und Ergebnisse der Belegarbeit Zu den wichtigsten Anforderungen des Gro en Beleges geh rte es ein Verfahren zu entwickeln das es Autoren von Hochschulschriften an der TU Dresden erm glicht diese Dokumente an die SLU
209. findliches Objekt inklusive aller seiner nicht transienten Attribute und Methoden in Form einer bin ren Datei gespeichert wird 17Man ben tigt keine zus tzlichen Technologien und der Vorgang ist relativ schnell 81 3 Systemarchitektur eine ad quate Java Objektstruktur im Hauptspeicher zur ckwandeln Bei jeder weite ren i d R inkrementellen nderung des Metadatensatzes in den AdminTools w rde sich dieser Vorgang wiederholen Die Repr sentation als XML Struktur ist dabei auf grund der hierarchischen Struktur des Dublin Core Element Set relativ problemlos und sollte formal etwa wie in Listing 4 aussehen 1 lt xml version 1 0 encoding ISO 8859 1 gt 2 lt metadataset gt 3 lt dc element gt lt dc element gt lt dc element gt lt dc subelement gt lt dc subelement gt lt temp gt lt temp element gt lt temp element gt lt temp gt 4 5 6 7 8 9 0 ren 1 lt dc element gt 2 3 4 5 6 7 8 lt metadataset gt Listing 4 formale XML Struktur eines Metadatensatzes Wie dem Listing zu entnehmen ist beinhaltet ein Metadatensatz zu diesem Zeit punkt nicht nur die Metadaten nach dem Dublin Core Format sondern auch tempor re Metadaten f r die es keine Dublin Core Entsprechung gibt Die erste Architektur vision lautet also Architekturvision 1 Bis zum endg ltigen Einstellen von Metadatens tzen erfolgen alle tempor r persistenten Manifestat
210. g der Belegarbeit aber nicht realisiert werden konnten Diese Punkte sind auch f r das Diplom nicht von vordergr ndigem Interesse da es nicht um die billige Rea lisierung eines Produktivsystems f r die SLUB geht sondern um die prototypische Implementierung technisch und akademisch interessanter Fragen die auch bergrei fend von Interesse sind Erstgenannte Verbesserungen k nnten aber durchaus von den in der Aufgabenstellung erw hnten Auszubildenden der SLUB mit entsprechenden Hilfestellungen realisiert werden Zu den im Diplom zu beachtenden sich aus der Belegarbeit ergebenden Ver besserungsm glichkeiten geh ren vor allem die konsequente serverseitige Validierung der Metadaten in der ersten Teilanwendung sowie die schon angesprochene daten bankbasierte Speicherung der Metadaten Eine lohnende Weiterentwicklung w re eine erh hte Flexibilit t der Anwendungen durch weitgehende Konfigurierbarkeit In die sem Zusammenhang ist XML als m gliches Format von Konfigurationsstrukturen zu pr fen Ebenso ist eine Integration von Kommunikationsstandards wie etwa Mail oder FTP in die Anwendungen zu berdenken Die im Beleg erstellten Arbeitsabl ufe sind noch detaillierter zu spezifizieren und in Zusammenarbeit mit den Institutionen SLUB DDB Die Deutsche Bibliothek und SWB S dwestdeutscher Bibliotheksverbund in die Praxis umzusetzen Bei der berarbeitung der vorhandenen Implementationen hier wurde in der Beleg Version zum Teil nur
211. genannten bermittlungsarten 71 3 Systemarchitektur Fehlermeldung 6 Die Prim r Metadaten des Autors werden mit Hilfe der Admi nistrationsanwendung Admin Tools validiert 7 und ein Ausdruck derselben an das Referat 3 4 verschickt 8 Dieser Ausdruck dient dem Referat 3 4 als Information dass ein elektronischer Bericht abgegeben wurde So kann sich dieses Referat darum bem hen auch ein Druckexemplar dieses Berichtes zu erlangen Dieses kann sp ter anhand der dann von der elektronischen Version im OPAC verf gbaren Informationen katalogisiert werden was aber au erhalb des hier betrachteten Gesch ftsmodells f r Berichte liegt x Referat 5 3 AdminTools Referat 3 4 Autor 1 MG nutzen MetadatenGenerator 2 Nachricht an Referat 5 3 3 Best tigung ession beenden 4 Abgabe des el Dokuments rss d el Dokunfonts 7 Validierung der Prim r Mefadaten 6 Best tigung Fehlermeldung 8 Ausdruck der Prim r Metaplaten Abbildung 9 Sequenzdiagramm Gesch ftsgang f r Berichte Teil 1 Abbildung 10 zeigt auf der folgenden Seite den zweiten Teil des Sequenzdia gramms Hier wird als erstes ein Ausdruck der Prim r Metadaten an den entspre chenden Fachreferenten der Abteilung 10 bzw 11 geschickt 9 Der Fachreferent nimmt die Sacherschlie ung vor und liefert die entstandenen Sekund r Metadaten an das Referat 5 3 zur ck 10 Diese sekund ren Metadaten werd
212. gle ton realisiert ist und den zentralen Zugriffspunkt der Anwendung auf Datenbanken darstellt Der DBManager fungiert dabei als Wrapper der Interna vor der Anwen dung verbirgt und stattdessen die Interaktion ber wenige wohldefinierte Methoden erlaubt so liefert die Klasse Datenbankverbindungen Connection und Transaktions objekte Transaction und erm glicht weitere Datenbankmanipulationen Von au en 118 3 3 Architekturdetails k nnen dabei ber Konfigurationsstrukturen Teile des Verhaltens bestimmt werden Die Klasse DBManager kann dabei fiir bestimmte Datenbanken von weiteren Klassen spezialisiert werden so wie in der Abbildung die Klasse SybaseDBManager Die Klasse Transaction stellt ein Objekt zur Verf gung welches f r die Anwendung eine Trans aktion kapselt Alle Befehle die ber dieses Objekt besser ber dessen Connection Object an die Datenbank abgesetzt werden gehorchen dem ACID Prinzip und wer den somit gemeinsam und vollst ndig oder aber gar nicht ausgef hrt Dazu bietet die Klasse typische Methoden wie commit bzw rollback Daneben existieren zwei Klassen f r die zwei typischen Bereiche in denen die Anwendung externe Daten liest bzw schreibt der Umgang mit Konfigurationsstrukturen bzw mit Metadaten s tzen F r den ersten Fall liefert die Klasse ConfigurationManager die notwendige Funktionalit t um auf datenbankbasierte Konfigurationsstrukturen zugreifen zu k n nen Die Klasse TemporalM
213. gt und die stabile URL zugewiesen wurde ist der bereits im Beleg konzipierte Export an die Systeme OPUS und bibliographisch relevante Verbundsysteme z Bsp SWB oder Datenbanken der Deutschen Bibliothek zu testen Soll der Server einmal in den Produktionsbetrieb gehen muss auch seine Sicherheit gew hrleistet sein Hier wird von der Diplomarbeit keine perfekte L sung erwartet weil das zu viel Zeit kosten und vom eigentlichen Thema ablenken w rde Was sich aber bei der Realisierung durch einfaches Einschalten aktivieren l sst sollte auch genutzt werden Bestimmte Zugriffe sind eben nur dem Autor oder der SLUB gestattet das sollte der Server weitgehend si cherstellen Als dritter Baustein des Systems nach Autoren und SLUB Eingabe und als wichtigste Anwendung der Datenbank ist dann die Oberfl che zum Navigieren und 28 2 1 Aufgabenstellung der Diplomarbeit Suchen auf dem Server zu entwerfen und prototypisch zu realisieren Die Navigation sollte eine hierarchische Struktur verwenden die Fakult ten und Institute listet Die Suche st tzt sich auf Autorennamen Titel Schlagworte und ggf weitere Metadaten Es sind entsprechende Web Seiten zu gestalten Im Unterschied zum Gro en Beleg erfolgen die Arbeiten jetzt direkt auf den Zielrechner in der SLUB Dort ist das im Beleg erstellte System bereits installiert Das gew hlte Systemkonzept ist laufend zu berpr fen und an den Anforderungen zu messen Alternative Konzepte sind der Li
214. halb auch f r zuk nftige Erweiterungen und Verbesserungen eine gewisse G ltig keit behalten Parallel dazu wurde der Spezifikation der Arbeitsabl ufe und Gesch fts modelle die sich f r den Hochschulschriftenserver ergaben besondere Aufmerksamkeit geschenkt Die beiden entstandenen Gesch ftsmodelle f r die beiden derzeit vom HSSS unterst tzten Dokumentenarten wurden mit allen beteiligten internen und externen Institutionen abgestimmt und konnten bereits ausf hrlich und erfolgreich getestet wer den Aufbauend auf diesen Ergebnissen erfolgte die Konkretisierung und Priorisierung der Architekturvisionen auf die durch die von der Diplomarbeit zu realisierenden Be reiche So konnten f r die Gesamtanwendung aber auch f r die drei Teilanwendungen konkrete Anforderungen aufgestellt werden Nun erfolgte die objektorientierte Analyse der Gesamtanwendung und die berar beitung der bereits in der Belegarbeit entstandenen Version des MetadatenGenerators Dabei wurde auf eine m glichst lose Kopplung der einzelnen Komponenten sowie auf die Integration von passenden Entwurfsmustern geachtet F r die gesamte Anwendung 220 8 1 Zusammenfassung und insbesondere f r den MetadatenGenerator wurde dabei ein flexibles Konzept reali siert das es erm glicht viele Informationen in externe XML basierte Konfigurations strukturen auszulagern so dass wesentliche Teile der Anwendung konfigurierbar sind ohne dass in den Quellcode des bestehenden
215. haltlich den anfangs eingef hrten Teilanwendungen 1 und 2 entsprechen Diese Teilanwendungen konnten erfolgreich realisiert und getestet wer den und best tigten die getroffenen Technologieentscheidungen 33 2 Aufgabenstellung Grundlagen Arbeitsabl ufe Durch die konsequente Verwendung von moderner plattformunabh ngiger Inter nettechnologie konnte schon im Rahmen der Belegarbeit eine L sung aufgezeigt wer den die sich von etablierten Alternativen unterscheidet und vor allem in den Bereichen Skalierbarkeit Erweiterbarkeit und Zukunftsf higkeit teilweise deutliche Vorteile bie tet Ein gro er Teil dieser L sung kann auch ohne jegliche Abstriche f r die Diplom arbeit verwendet und in die zu implementierenden Anwendungen integriert werden ein weiterer Teil kann zumindest als Ausgangsbasis f r weitere Entwicklungen dienen Trotzdem gibt es nat rlich auch einige Punkte die verbesserungsw rdig erscheinen teilweise wurde auf diese Schw chen auch schon am Ende der Belegarbeit verwiesen Sie sollen nach M glichkeit im Rahmen des Diploms behoben werden Der folgende Abschnitt geht noch einmal kurz auf einige Verbesserungsm glichkeiten ein 2 3 2 Verbesserungsm glichkeiten Zu den in der Belegarbeit angesprochenen Verbesserungsm glichkeiten z hlten eine Reihe von Diensten die f r eine Produktivversion eines Hochschulschriftenservers w nschenswert w ren aufgrund der geringen Zeitdauer und der akademischen Aus richtun
216. hert werden allerdings erfol gen die nderungen direkt an den XML Daten so dass entsprechende Kennt nisse vorausgesetzt sind Benutzerfreundlicher w re eine Indirektion welche die XML Struktur vor den Nutzern verbirgt und die entsprechenden Daten statt dessen zum Beispiel Formular basiert pr sentiert Diese Anwendung sollte die XML Daten gleichzeitig auch vor unsinnigen nderungen sch tzen die im Extremfall die gesamte Anwendung vor bergehend au er Betrieb setzten k nn ten 175 6 Teilanwendung 3 HSSS AccessTools myHSSS Inhalt des Kapitels a A S 178 ER 185 Da a EE 186 6 2 2 Integration von Lucene in die Anwendung 191 6 3 BRe lisierung si ro 197 6 4 Einsch tzung co In sa nenne 205 177 6 Teilanwendung 3 HSSS AccessTools myHSSS 6 1 Realisierung einer absoluten URL F r die dritte Teilanwendung die den webbasierten Zugriff auf die Hochschulschriften des HSSS bzw die Suche und Navigation ber deren Metadateninformationen reali sieren soll ist eine funktionierende und dabei m glichst performante und skalierbare Abbildung von absoluten URL s auf reale URL s eine Grundvoraussetzung Denn je den Treffer soll diese Teilanwendung als stabile URL pr sentieren erst ein Klick auf eine solche URL f hrt den Nutzer ber die zu realisierende Abbildung zu der momen tan realen Adresse der entsprechenden Ressource Eine Abbildung wird also f r jeden Zugriff notw
217. hl von Servlets bestehen kann die jeweils einzeln konfigurierbar sind zwischen den lt servlet gt Tags Die M glichkeiten dieser Konfigurationsdatei sind allerdings sehr eingeschr nkt da sich Informationen an die Anwendung nur in Form von Parameter Wert Paaren lt param name gt bzw lt param value gt jeweils in nerhalb eines lt init param gt Tags weitergeben lassen Es macht daher Sinn nur die fundamentalsten bzw relativ unstrukturierte Konfigurationsparameter auf diese Wei se direkt an die Anwendung zu bermitteln und weitere Informationen in separaten XML Strukturen zur Verf gung zu stellen deren Lokation der Anwendung allerdings bekannt gemacht werden muss siehe Zeilen 13 bis 16 im Listing In diesem Fall wird eine Lokation im Dateisystem angegeben genausogut k nnte aber eine URL oder eine Datenbankverbindung angegeben werden Auf diese Art und Weise wird die Gesamt anwendung des HSSS ber die Lokation der verschiedenen Konfigurationsstrukturer informiert die in Tabelle 4 n her erl utert werde Konfigurationsstruktur INHALTSBESCHREIBUNG web xml Enth lt wie bereits beschrieben die all gemeinen Konfigurationsparameter der Web Application HSSS in XML basierter Form hsssdata xml Enth lt Konfigurationsdaten die den gesamten Hochschulschriftenserver HSSS betreffen wie z Bsp unterst tzte Sprachen Formate usw in XML basierter Form MetadataSetDissertation xml Enth lt die XML basierte Metadatens
218. hrend der Diplomarbeit zu erstellenden ersten Ausbaustufe des HSSS ber cksichtigt werden Aus diesem Grund muss eine be gr ndete Auswahl getroffen werden wobei die Kosten Nutzen Relation zwischen dem erwarteten Implementierungsaufwand und der Priorit t der jeweiligen Anforderung zu beachten ist Ein gro er Teil der geforderten Merkmale eines Dokumentenservers konnte schon in der durch die Belegarbeit entstandenen Version des HSSS realisiert werden Schb00 Dazu z hlen e Ein vorl ufiges noch zu erweiterndes Gesch ftsmodell e Die Unterst tzung des Metadatenformats nach Dublin Core e Die Spezifikation von Metadatens tzen f r die zu unterst tzenden Dokumente narten e Fine Analyse der in Frage kommenden Technologien f r die Realisierung eines Dokumentenservers 25 Auch der Bereich der XML Technologien l sst sich mit Open Source Software ausgezeichnet ab decken So bietet die ASF u a einen hervorragenden XML Parser Xerxes eine XSLT Engine Xalan sowie Implementationen diverser XML Protokolle z Bsp SOAP 98 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld e Eine begr ndete Technologieentscheidung sowie eine lauff hige Kombination von Softwaresystemen Web Server Servlet Container etc die als Grundlage f r die zu erstellenden Anwendungen dienen e Fine Anwendung die es Autoren erlaubt Metadaten zu ihren Dokumenten zu erstellen und diese an die SLUB zu senden e Ein
219. hster Punkt der den Entwurf des Datenbank Schemas aber auch die Eva luation der Datenbank beeinflussen k nnte kann aus den erwarteten Anfragen ab geleitet werden insbesondere was deren vermutete Komplexit t bzw Ausrichtung betrifft F r die Teilanwendungen MetadatenGenerator und AdminTools besteht die Mehrzahl der Anfragen darin die tempor ren Metadatens tze aus der Datenbank aus zulesen und ge ndert wieder abzuspeichern Am Ende der Bearbeitung durch die AdminTools wird der Metadatensatz endg ltig persistent abgelegt aufgrund seiner ge ordneten hierarchischen Struktur ist eine zumindest hnliche Struktur des Schemas zu erwarten Alle weiteren Anfragen in Bezug auf einen solchen Metadatensatz sind lesende Anfragen vor allem durch die Teilanwendung AccessTools 1 welche die Me tadateninformationen z Bsp f r einen Suchvorgang oder eine Navigation liefern sollen Zusammenfassend l sst sich also sagen dass insbesondere auf die endg ltig persistent vorliegenden Metadatens tze mehrheitlich lesend zugegriffen werden wird wobei diese Zugriffe relativ zeitkritisch und daher durch das Schema bzw durch die Datenbank so gut wie m glich zu unterst tzen sind Im Hinblick auf die technologische Ausrichtung des Gesamtsystems lassen sich noch weitere Kriterien aufz hlen die w nschenswert jedoch nicht existenziell sind So w re eine Integration von Java z Bsp durch die Unterst tzung als Datentyp oder als m gliche Sprache f
220. hten Konvertierbarkeit der Dokumente Anhand dieser Aufz hlung wird schnell klar dass sich alle diese Anforderungen nicht durch ein einziges Dokumentenformat realisieren lassen Daher empfiehlt die Arbeits gruppe eine Unterscheidung in Erstellungs bzw Lieferformate Pr sentationsforma te Retrievalformate und Archivierungsformate vorzunehmen und in diesen Bereichen m glicherweise verschiedene jeweils pr destinierte Formate zu verwenden Au erdem werden eine Reihe von Konvertierungswerkzeugen vorgestellt Danach wird noch einmal sehr intensiv die Nutzung von Metadaten beschrieben Die Empfehlungen konzentrieren sich dabei auf Metadaten nach Dublin Core L DC und beschreibt den Einsatz dieses Metadatenformates in verschiedenen Formen so zum Beispiel die Nutzung von Dublin Core innerhalb von HTML 4 0 Tags META Tags nach ISO IEC 11179 und die Abbildung auf das MAB Format Maschinelles Aus tauschformat f r Bibliotheken Interessant ist aber vor allem der Ausblick auf eine XML basierte Darstellungsform von Dublin Core Metadaten In diesem Fall han delt es sich um das XML basierte Datenmodell DLmeta das f r die Integration al ler Mediengattungen im Bereich des Bibliotheksservice Zentrums Baden W rttemberg entwickelt wurde F r die Zukunft ist es absolut w nschenswert Dublin Core Metada ten generell XML basiert vorzuhalten die Verwendung eines gemeinsamen Schemad w rde den Aufwand des Datenaustauschs zwischen den verschied
221. i e Im Vergleich zu allen Alternativen besitzt die gew hlte Technologie eine Reihe von Alleinstellungsmerkmalen die sich aus einem technologischen und konzep tionellen Vorsprung ergeben 3 3 2 2 Objektorientierte Analyse und Design Schon im Beleg wurden Entwurf und Implementation des Gesamtsystems nach objekt orientierten Prinzipien gestaltet also insbesondere durch objektorientierte Analyse 99 3 Systemarchitektur bzw Design vorbereitet Selbstverst ndlich wurde diese Vorgehensweise auch w hrend des Diploms beibehalten Ein erster Schritt bestand dabei in der genauen Analyse und der Spezifikation der Gesch ftsmodelle und aller damit in Zusammenhang stehenden Arbeitsabl ufe was bereits ausf hrlich in Abschnitt ab Seite 62 beschrieben wur de Die hier gewonnenen Informationen wurden als Ausgangspunkt f r alle weiteren objektorientierten Analysen verwendet die das Design und die Architektur des Ge samtsystems betrafen Dabei wurde die bereits in der Belegarbeit aufgestellte Maxi me beibehalten die Gesamtanwendung nach logischen Gesichtspunkten zu separieren Dies wurde durch eine entsprechende Package Struktul der Gesamtanwendung in Java realisiert Abbildung 20 zeigt diese Package Struktur welche die Gesamtan wendung in einer sehr groben Granularit t strukturiert bzw schichtet siehe dazu auch den folgenden Abschnitt 3 3 2 3 ab Seite 105 admintools accesstools metadatagenerator temporalper
222. i es Java 2 Collection Framework und Generic Collection Library for Java Addison Wesley 2000 Graham Hamilton JavaBeans Specification Version 1 01 Sun Micro systems Jul 1997 Elliotte Rusty Harold Java Network Programming O Reilly 2000 2 Auflage Graham Hammilton Rick Catell Maydene Fisher JDBC Datenbankzu griff mit JAVA Addison Wesley 1998 Andreas Heuer Gunter Saake Datenbanken Konzepte und Sprachen mitp 2000 Andreas Holubeck Java Network Launcher Protocol und WebStart im Detail Java Magazin 11 2000 Jason Hunter William Crawford Java Servlet Programming O Reilly 1998 Michael Jurisch Christian Michel Sebastian Schulz Dokumentation der Konfigurationsdateien des HSSS SLUB Jul 2001 Ben Laurie and Peter Laurie Apache O Reilly 1999 Dieser Titel wurde vom Autor in Ermangelung eines bestehenden Titels vergeben Leider liegt dieses Arbeitspapier auch nur in schriftlicher Form vor uns ist anderthalb Monate nach seiner Ver ffentlichung noch nicht auf der Projektseite der Arbeitsgruppe verf gbar 287 Literaturverzeichnis Lea97 LFB00 McL00 NaM99 Nie99 Oes98 Pek00 PLC99 Rie97 Roe00 RoS99 Scha00 Schb00 Sie00a Sie00b SMGO00 Doug Lea Concurrent Programming in Java Addison Wesley 1997 Peter Lipp Johannes Farmer Dieter Bratko Wolfgang Platzer Andreas Sterbenz Sicherhe
223. ichen Rahmen liegt Die zweite Architekturvision entwickelt sich ebenfalls aus der Betrachtung der ers ten zwei Anwendungen in Verbindung mit dem Metadatensatzformat Letztendlich bestimmen Art Umfang und Struktur des Metadatensatzes gro e Teile dieser Anwen dungen sowohl was deren interne Struktur aber auch externe Merkmale wie Layout der Benutzerschnittstelle und Flusskontrolle etc betrifft In Abbildung 17 wird dies beispielhaft verdeutlicht vor allem durch die Beziehung Metadatensatzbeschreibung grafische Benutzerschnittstelle Server seitige Anwendung Ein Originaltitel ist ein Originaltitel obligatorischer Bestandteil des Metadatensatzes Er wa geh rt zu den prim ren Unfertitel Metadaten die vom Autor y a FE nur einen Originaltitel geben Ein Untertitel optionaler Bestandteil Er geh rt ebenfalls zu den Benutzerschnittstelle MetadatenGenerator prim ren Metadaten und 11 kann maximal zwei ma auftreten Assert Originaltitel min 1 A Assert Originaltitel max 1 Metadatensatz Server seitige Anwendung Abbildung 17 Einfluss der Metadatensatzbeschreibung auf die Anwendung 83 3 Systemarchitektur Wie aus der Abbildung ersichtlich ist hat die Metadatensatzbeschreibung einen erheblichen Einfluss auf die grafische Benutzerschnittstelle aber auch auf die eigent liche Anwendung So beeinflusst beispielsweise die Festlegung ob ein Element bzw Unterelement des Metadatensatzes optional ode
224. ichnung NACHRICHT DES AUTORS Beschreibung Mitteilung des Autors an die SLUB Mitarbeiter DC Bezeichnung keine Parametername temp _ author message Metadatentyp primary Regulation optional H ufigkeit 1 1 Langenrestriktion 5 2000 Tabelle A54 HSSS Metadatensatz Nachricht des Autors 248 B Konfigurationsstrukturen des HSSS Inhalt des Kapitels A 250 Aud A Bee ae A e 251 Rn a EE 253 255 EE 257 249 B Konfigurationsstrukturen des HSSS B 1 berblick Dieses Kapitel erl utert die Konfigurationsstrukturen des HSSS welche sich aus den Anforderungen bzw aus den Architekturvisionen ergeben haben und in relativ kom plexer Form vorliegen Dabei teilen sich die Konfigurationsstrukturen semantisch in verschiedene Bereiche auf die in den folgenden Abschnitten getrennt behandelt wer den Zuerst wird die Konfigurationsdatei web xml erl utert welche die grundlegends ten Einstellungen enth lt die die Servlets der Web Anwendung betreffen Anschlie Bend folgt die Konfigurationsstruktur hsssdata xml die insbesondere Daten bein haltet die die gesamte HSSS Anwendung betreffen Die Konfigurationsstrukturen MetadataSetDissertation bzw MetadataSetBericht beschreiben die Metadaten s tze der jeweiligen Dokumentenart Die letzte Konfigurationsstruktur oaisets xml spezifiziert die optionale Set Struktur der OAI Protokoll Implementatiojn des HSSS 250 B 2 web xml B 2 web xml Bei der Konfiguratio
225. ie im besten Fall auch hard und softwareunabh ngig sein sollten Als mittelfristiger Kompromiss gilt auch hier die Nutzung von m glichst weit verbreiteten Formaten Es folgt ein mit Empfehlungen an die Hochschulen berschriebener Abschnitt in dem es im Wesentlichen um organisatorische und rechtliche Belange geht Ein interessanter Teil dieses Abschnitts besch ftigt sich mit der Notwendigkeit von Wei terbildungsma nahmen und zwar sowohl f r die Autoren als auch f r das Dienstleis tungspersonal von Bibliotheken oder Rechenzentren Da es f r eine wirklich effektive Archivierung und flexible Pr sentation notwendig ist zunehmend XML respektive SGML basiert zu publizieren m ssen die Autoren speziell in diesem Bereich geschult und beraten werden So k nnten Formatvorlagen f r g ngige Textverarbeitungssyste me entwickelt und eingef hrt werden die eine sp tere Konvertierung in ein struktu riertes Format erleichtern aber auch die direkte Erstellung von XML bzw SGML Dokumenten sollte durch entsprechende Schulungen gef rdert werden Au erdem soll te auch der an der jeweiligen Institution etablierte Workflow im Zusammenhang mit dem digitalen Publizieren auf Informationsveranstaltungen regelm ig vorgestellt und erl utert werden F r das Dienstleistungspersonal d rfte der Weiterbildungsbedarf in den meisten F llen noch gr er sein So wird in dem Empfehlungspapier der Dies schreibt die Arbeitsgruppe einer Initiative
226. ie M glichkeit ohne Programmierkenntnisse weite Teile des Verhaltens und des Designs des MetadatenGenerators bestimmen zu k nnen vor allem die Pr sentation der Metadatenelemente VT sowie deren Behandlung bei der clientseitigen und Server seitigen Validierung siehe auch Abschnitt Blim Anhang Dar ber hinaus wurden im Abschnitt noch weitergehende Konzepte vorgestellt welche auf den vorhan denen F higkeiten der Teilanwendung aufbauen und diese noch wesentlich erweitern k nnen Trotzdem finden sich nat rlich auch f r den MetadatenGenerator eine Rei he von Verbesserungsm glichkeiten bzw sinnvolle Erweiterungen Diese m glichen Verbesserungen werden in Kapitel noch einmal strukturiert zusammengefasst und sollen hier nur kurz aufgez hlt und begr ndet werden e Zur Zeit bernimmt der MetadatenGenerator Daten erst durch das Klicken auf den Weiter Buttod Hat ein Nutzer ein Formular bereits ausgef llt und klickt anschlie end aber auf Zur ck gehen die eben eingetragenen Daten verloren Dieser Zustand kann mit einigem Aufwand verbessert werden so dass auch bei Zur ck die Daten bernommen werden die dann aber noch nicht validiert werden sollten weder clientseitig noch Server seitig e Es w re von Vorteil wenn in jedem Formular eine minimierte Site Map vielleicht als dynamisches Symbol zur Orientierung zur Verf gung st nde Au erdem k nnte man dann in Spr ngen navigieren was insbesondere bei der Kor
227. ie schwankt von 640 480 bis 1600 1200 Bildpunkten also um den Faktor 2 5 2380 geschehen f r den MetadatenGenerator 24Bei DHTML Dynamic HTML handelt es sich um einen Sammelbegriff f r verschiedene L sungen 86 3 2 Architekturtibersicht u erst fehleranf llig und wartungsintensiv Die beste L sung besteht nach Meinung des Autors darin Server seitig eine beliebige Skalierung der Benutzerschnittstelle zu erm glichen wobei das Layout so konsistent wie m glich bleiben sollte Die Wahl der Aufl sung sollte dabei nicht von der Anwendung anhand der tats chlichen oder vermu teten Bildschirmaufl sung getroffen werden sondern vom Nutzer bestimmt werden k nnen Die dritte sich auf die mit AccessTools betitelte Teilanwendung beziehende Architekturversion lautet daher Architekturvision 3 Der Nutzer der dritten Web Anwendung kann diese in ihrer Aufl sung flexibel ndern wobei das verwendete Layout in sich konsistent bleibt Dies setzt voraus dass alle Inhalte auch Schrift Bilder etc Server seitig skaliert werden Diese dritte Teilanwendung realisiert dabei die Suche Volltextsuche Feldsuche und die Navigation ber den Metadaten Sie sollte dazu insbesondere f r die Su che eine bersichtliche und leicht verst ndliche Schnittstelle besitzen welche eine von Suchmaschinen gewohnte Funktionalit t bietet Da auf der Serverseite eine moder ne Architektur verwendet wird welche die Behandlung von HTTP Sitzungen relativ
228. ie verschiedenen Ansichten der Prim rmetadaten f r den Fachreferenten HTML Version Text Version f r die E Mail PDF Version auf diese Art und Weise ndern Schlie lich kann auch die Vorlage zur automatischen Erstellung der Frontdoors an dieser Stelle erweitert bzw ge ndert werden Durch das Klicken des Buttons Logdateien wird dem Nutzer ein Formular pr sentiert auf dem er sich alle Logdateien des Systems anzeigen lassen kann was ins besondere der Fehlersuche dient SQL aktiviert einen Web basierten SQL Client durch den SQL Befehle direkt an die Datenbank des HSSS abgesetzt werden k nnen Der Button ToolBox f hrt zu einer Sammlung von wichtigen Aktionen zur Admi nistration des Gesamtsystems Auch dieses Formular ist nur Administrator Nutzern zug nglich und bietet zur Zeit die Aktionen Frontdoors aktualisieren und Index neu aufbauen Erstere Aktion erstellt f r alle Metadatens tze die in der persistenten Datenbasis gespeichert sind die Frontdoor neu Diese Aktion ist insbesondere dann sinnvoll wenn durch die Aktion Stylesheets die Vorlage zur automatischen Generie rung der Frontdoors ge ndert wurde und sich diese nderung nicht nur auf alle noch folgenden Metadatens tze sondern auch auf die schon eingestellten auswirken soll Die zweite Aktion Index neu aufbauen f hrt dazu dass der Index der verwendeten Volltextsuchmaschine siehe dazu Abschnitt ab Seite komplett neu f r alle persist
229. iel welches in der Praxis den Einsatz von TagLibs selbstverst ndlich noch nicht rechtfertigen w rde ohne TagLib lt body gt lt b gt Es ist genau lt b gt lt Date d new java util Date gt lt d toString gt lt body gt oo ob G HM A 9 mit TagLib 11 lt taglib uri myTagLib prefix myTags gt 13 lt body gt 14 lt b gt Es ist genau lt b gt 15 lt myTags CurrntDate gt 16 lt body gt Listing 7 Einfaches Beispiel f r den Einsatz von TagLibs Trotzdem l sst sich an dem Beispiel bereits gut erkennen dass diese Technologie richtig angewendet zu einer weiteren Entkopplung von Pr sentation und Anwen dungslogik f hrt und damit auch zu einer noch besseren Trennung der verschiedenen 110 3 3 Architekturdetails Rollen innerhalb des Entwicklungsprozesses von Webanwendungen Roe00 Die Defi nition solcher Bibliotheken ist allerdings relativ aufwendig und verlangt eine gewisse Erfahrung um m glichst flexibel einsetzbare Tags zu generieren Deshalb wird diese Technologie im Rahmen der Diplomarbeit auch keine Anwendung finden bleibt aber f r die zuk nftige Entwicklung des HSSS eine interessante Option siehe dazu auch Abschnitt 8 2 3 3 3 2 Technologische Alternativen Ist die Entscheidung f r eine Webanwendung gefallen gibt es auf der Architekturebene clientseitig kaum weitere Alternativen neben den im vorangegangenen Abschnitt vor gestellten Neb
230. iert mit Hilfe von XSLT L XLaf erstellt und ist durch den Nutzer einsehbar indem er auf den Link unter Anhang klickt Der Klick auf Absenden sendet an die voreingestellte Adresse der DDB eine E Mail mit dem beschriebenen Betreff einem optionalen Nachrichtentext und einer HTML basierten Anhangsdatei in der die Ex portmetadaten in dem vorgeschriebenen Format der DDB kodiert sind Im Falle des SWB Exportes wird ein hnliches Fenster pr sentiert allerdings er folgt der Export FTP basiert so dass zur Realisierung nat rlich andere Technologien verwendet werderf Die Adresse des FTP Servers ist der Anwendung ebenfalls bereits durch die Konfigurationsstruktur hsssdata xml bekannt Auch in diesem Fall wird zur Kodierung der Export Informationen eine HTML basierte Datei verwendet die eben falls automatisch erstellt wird und vom Nutzer eingesehen werden kann Bei einem Klick auf den Button in FTP Verzeichnis einstellen wird die Datei automatisch auf dem spezifizierten Server in das angegebene Verzeichnis abgelegt F r beide Exporte wird der Exportstatus von der Anwendung automatisch auf Metadaten exportiert gesetzt gleichzeitig wird der genaue Zeitpunkt des Exports vermerkt Nun sind fast alle Voraussetzungen f r das Einstellen der Metadaten in die per sistente Datenbasis des Gesamtsystems gegeben Parallel zu den bisher beschriebenen Schritten sollte ebenfalls das Dokument bearbeitet worden sein Die Bearbeitung be steht
231. ierte Teil strukturen sind die entstehenden realen Verzeichnisstrukturen manuell kaum zu ber blicken was bei einem Ausfall des Systems dazu f hren kann dass die Daten obwohl vorhanden schlecht bis gar nicht zu verwalten sind Wie in Abschnitt be schrieben wurde daher eine automatisch erstellbare Bearbeitungsnummer bevorzugt die keine weiteren Informationen ben tigt Gleichzeitig wird vom System eine reale Verzeichnisstruktur welche die reale URL beeinflusst konstruiert die im Notfall eine manuelle Verwaltung erlaubt und damit vom Kontext der entsprechenden Ressource abh ngig ist Ein Beispiel f r ein solches Verzeichnis ist lt webserver root gt dissertation 2001 wirtschaftswissenschaften 994670019875 4119 Diese Struktur besteht aus der Dokumentenart dem Ver ffentlichungsjahr der ver ffentlichenden Fakult t und der Bearbeitungsnummer der Hochschulschrift wodurch im Extremfall bereits eine rudiment re Navigation auch webbasiert m glich w re Durch die absolut eindeutige Bearbeitungsnummer lassen sich diese Verzeichnisse auch ausgezeichnet manuell reorganisieren Innerhalb der Metadatensatzspezifikation siehe dazu Abschnitt im Anhang ab Seite sind deshalb auch zwei Subelemente der Kategorie DC Identifier definiert was bei Verfolgung des zweiten Ansatzes nicht notwendig w re Aus diesen Gr nden bot sich eine direkte Abbildung von zwei persistenten URL s durch das System an wobei die zu erwartenden Nachteile in de
232. ig auf einen bestimmten Akteur fokussiert ist Am Beginn des Arbeitsablaufs steht der Autor ei ner Dissertation der sich entschieden hat diese auf elektronischem Wege weltweit langfristig verf gbar zu machen Abbildung 2 zeigt ein Anwendungsfalldiagramm welches den Kontext des Gesamtsystems speziell aus dem Blickwinkel des Autors be schreibt SLUB Gesch ftsmodell f r Dissertationen Metadaten bermitteln f Autor Referat 5 3 elektronische Version der Doktorarbeit bermitteln Druckexemplare der Doktorarbeit x abgeben Referat 3 4 Abbildung 2 Anwendungsfalldiagramm Kontext des Systems f r den Autor Wie die Abbildung zeigt lassen sich f r den Akteur insgesamt drei Anwendungsf l le ausmachen bei denen er mit dem Gesamtsystem interagiert Als erstes wird er ber eine vom System zur Verf gung zu stellende Schnittstelle Metadaten bermitteln die ihn und insbesondere sein Dokument beschreiben Als n chstes wird der Autor die elektronische Version seiner Dissertation in einem bestimmten Format an das System bermitteln Welches Format verwendet werden darf und ob die bermittlung eben falls ber die Metadatenschnittstelle erfolgt oder getrennt davon ist dabei auf diesem Abstraktionsniveau nicht von Interesse Mit den beiden bis hierher beschriebenen An wendungsf llen steht ebenfalls der Akteur Referat 5 3 in Verbindung Als letztes muss der Autor dem System eine gewisse Anzahl an Druckexemplaren seines Doku m
233. in eine quivalente Objektstruktur umgeformt werden kann Die Spalte metadataset beinhaltet dabei die aktuelle Arbeitsversion des jeweiligen Metada tensatzes die Spalte mtadatasetcopy hingegen den originalen Metadatensatz so wie er vom Autor erstellt wurde so dass im Falle eines Datenverlusts durch eine falsche Bearbeitung des Metadatensatzes dieser stets wieder auf den Ausgangszustand zur ck gesetzt werden kann Dadurch kann verhindert werden dass die Prim r Metadaten des Autors noch einmal nachgefordert werden m ssen Desweiteren enth lt die Tabelle ei ne Reihe weiterer Spalten die jeweils Teile des Metadatensatzes insbesondere der tempor ren Metadaten direkt verf gbar machen so dass eine Anwendung die nur diese Informationen ben tigt diese nicht m hsam aus der XML Struktur herausfin den muss und daher auch keine zus tzlichen Werkzeuge wie etwa einen XML Parser ben tigt 135 4 Teilanwendung 1 MetadatenGenerator 4 4 Zus tzliche Funktionalit ten Neben der im Abschnitt 4 2 vorgestellten Teilanwendung MetadatenGenerator die alle wesentlichen Anforderungen erf llt gab es eine Reihe von weiteren Funktionalit ten die in diesem Zusammenhang zumindest w nschenswert waren Ein Teil dieser Zu satzfunktionalit ten konnte mit Hilfe zweier in der Abteilung Datenverarbeitung der SLUB besch ftigter Auszubildender schon im Rahmen der Diplomarbeit realisiert wer den Die folgenden Abschnitte sollen diese Reali
234. ines JSP empfehlen w rde Das Wissen welches diese Anwendung ben tigt scheint zun chst trivial eine Menge von Tupeln jeweils bestehend aus der absoluten und der realen URL Die interessante Frage lautet hier aber wie liegt dieses Wissen vor Hier bestehen im Wesentlichen zwei M glichkeiten die auf der n chsten Seite aufgef hrt sind Das gilt zum Beispiel f r den Nahmen des entsprechenden Webservers der als Alias definiert sein sollte und sich auch nicht ndern darf wenn der physische Rechner gewechselt wird 178 6 1 Realisierung einer absoluten URL 1 Das Wissen um die Abbildung liegt explizit vor Das bedeutet dass zu jeder absoluten URL an irgendeiner Stelle extern die Information vorliegt auf wel che reale URL diese abzubilden ist Es existieren zwei persistente URL s die absolute und die reale 2 Das Wissen um die Abbildung liegt implizit vor Das bedeutet dass keine externe Information zur Abbildung notwendig ist was voraussetzt dass alle daf r notwendigen Informationen bereits in der absoluten URL enthalten sind Es existiert mit der absoluten URL nur eine persistente URL Beide Ans tze haben spezifische Vor und Nachteile Der erste Ansatz hat den Vorteil dass es keine einheitliche Abbildungsfunktion gibt Deshalb sind flexible und auch unterschiedliche Abbildungen bei verschiedenen absoluten URL s m glich Bei dem zweiten Ansatz muss hingegen eine Berechnungsgrundlage f r die Abbildung existie
235. inzelnen Dokumentenarten unterschieden und die zugeh rigen Metadatens tze getrennt aufgef hrt Die jeweilige bersichts Tabelle enth lt nat r lich nur einige ausgew hlte Attribute dazu geh ren der Titel der Hochschulschrift die Bearbeitungsnummer die jeden Metadatensatz eindeutig identifiziert der Gesamtsta tus bzw Gesamtzustand sowie das Eingangsdatum im Falle eines neuen Metadaten satzes oder das Datum der letzten Bearbeitung Die verschiedenen Gesamtzust nde der Metadatens tze werden dabei von der Anwendung auch farblich hervorgehoben Jeder Metadatensatz kann selektiert werden um ihn anschlie end durch das Klicken auf einen der acht f r die Bearbeitung vorhandenen Buttons entsprechend zu behan deln In Tabelle 9 auf der n chsten Seite werden diese Buttons und ihre Bedeutung n her erl utert Auf der in Abbildung 41 gezeigten Seite der AdminTools k nnen aber auch bereits eingestellte Metadatens tze auf dieselbe Art und Weise behandelt werden indem der Radiobutton im unteren Teil der Abbildung von aktuelle auf eingestellte Metadatens tze ver ndert und anschlie end auf Aktualisieren geklickt wird Auch hier sind im Prinzip alle im folgenden beschrieben Aktionen anwendbar allerdings mit einigen Ausnahmen die im weiteren Verlauf erl utert werden also vom Eintreffen direkt nachdem die Autoren sie mit Hilfe des MetadatenGenerators erstellt haben bis zum finalen Gesamtzustand Vorgang abgeschlossen
236. iography gt Bibliographie lt abbreviation gt Abk rzungsverzeichnis lt vi ta gt Lebenslauf lt declaration gt Selbstst ndigkeitserkl rung und lt acknowled gements gt Danksagungen sowie frei definierbaren Anh ngen Die Vorteile die sich aus der Verwendung einer solchen Auszeichnungssprache er geben liegen klar auf der Hand e Es steht ein Archivierungsformat zur Verf gung welches im Vergleich zu an deren Formaten wesentlich einfacher ber Hard und Softwaregrenzen hinaus austauschbar ist e Durch die Aufnahme der Dokument Metadaten in den Deckblatt Teil des DiML Dokuments lassen sich genau diese Metadaten automatisiert gewinnen Voraus setzung ist dass nur Dokumente mit vollst ndigen Metadaten durch die DTD zu definieren vom Autoren abgegeben werden was sehr einfach durch einen entsprechenden Parser festgestellt werden kann e Durch die zus tzlichen strukturellen und inhaltsbasierten Informationen sind er heblich erweiterte Recherchem glichkeiten im Volltext gegeben e Das Format eignet sich ausgezeichnet als Ausgangsformat zur Generierung wei terer Zielformate wie etwa HTML oder PDF Insbesondere ist die Wahrschein lichkeit dass es sich auch in Zukunft zur Generierung noch unbekannter Do kumentenformate eignet im Vergleich zu herk mmlichen Dokumentenformaten wesentlich h her Ein m gliches Problem dieses Ansatzes ist allerdings die Generierung des Pr sen tationsformates aus der Auszeichnungs
237. ion eines solchen Clients in das Betriebssystem F r die Entwicklung der HSSS Teilanwendungen im Rahmen des Diploms kommt diese Technologie jedoch nicht in Frage da sich die zu realisierenden Benutzerschnitt stellen nach Meinung des Autors auch sehr gut und teilweise wesentlich effizienter webbasiert gestalten lassen Au erdem steckt die hier betrachtete Technologie teilwei se noch in den Kinderschuhen und muss ihre Wirksamkeit in der Praxis erst unter Beweis stellen Als Alternative zu den webbasierten Schnittstellen w ren zus tzlich vorhandene clientseitige Anwendungen in einer weiteren Ausbaustufe des HSSS aber sicherlich interessant wobei dies f r die einzelnen Teilanwendungen in unterschiedli chem Ma e ad siehe dazu auch Abschnitt ab Seite 222 3 3 4 Architekturdetails auf Datenbank Ebene In diesem Abschnitt sollen lediglich einige sehr allgemeine Aussagen zur Datenban karchitektur getroffen werden da sich die noch folgenden Kapitel zu dem einzelnen Teilanwendungen mit speziellen Fragen wie z Bsp dem Schemaentwurf besch ftigen werden Zun chst werden die grundlegendsten Anforderungen des Gesamtsystems an eine Datenbank bzw an ein Datenmodell aufgelistet danach erfolgt eine formale Datenbank Evaluation anhand dieser Kriterien 49Dabei ist die Definition verschiedener Sicherheitsstufen m glich z Bsp untrusted environment permissions j2ee application client permissions oder all permissions
238. ionen der Metadaten s tze als XML Struktur unabh ngig von der verwendeten Speicherungsart dateibasiert datenbankbasiert etc Die sich daraus ergebenden Vorteile sind insbesondere e Plattformunabh ngiges sowie sprachunabh ngiges flexibles ber Systemgrenzen hinweg austauschbares Persistenzformat f r tempor re Metadaten e Entkopplung Objektstruktur Persistenzstruktur insbesondere ist die Objekt struktur beliebig nderbar weil sich die zugeh rige XML Abbildung relativ ein fach ndern l sst 18Dabei handelt es sich haupts chlich um technisch notwendige tempor re Metadaten die zum Bei spiel Stati innerhalb der Arbeitsabl ufe beschreiben etc Diese Daten werden nicht endg ltig persistent eingestellt 82 3 2 Architekturtibersicht e Tempor re Daten sind auch au erhalb der vorgesehenen Anwendung verwertbar und verarbeitbar im Notfall sogar direkt manuell e Schon zu diesem Zeitpunkt lassen sich aus dem XML basierten Ausgangsformat der Metadaten relativ leicht diverse Zielformate z Bsp XML PDF HTML usw generieren etwa f r Reports etc Alle diese Vorteile f hren bei genauerer Betrachtung vor allem zu einer wesentlich erh hten Robustheit und Wiederverwendbarkeit der Gesamtanwendung und insbeson dere der tempor r persistenten Metadaten Als kleiner Nachteil ergibt sich lediglich der Aufwand zeitlich programmiertechnisch f r das Parsen der XML Struktur der allerdings in einem ertr gl
239. ionen dienen kann Diese Re ferenzimplementation sollte auch optionale Bereiche abdecken vor allem aber so weit wie m glich moderne zukunftstr chtige Technologien verwenden Beim derzeitigen Stand der Technik w ren nach Ansicht des Autors folgende Anforde rungen an eine solche Referenzimplementation sinnvoll Es sollte eine moderne Sprache und eine moderne Architektur gew hlt wer den Ideal w re Java in Verbindung mit Server Technologien wie Servlets bzw JSP s vielleicht auch die Implementation als J2EE Anwendung 97 2 Aufgabenstellung Grundlagen Arbeitsabl ufe Es sollten so weit es m glich ist Open Source Technologien verwendet wer den Die Referenzimplementation sollte deshalb den Apache Webserver und gegebenenfalls den Tomcat Servlet Container bzw einen EJB Container oder Enterprise Application Server wie etwa JBoss verwenden XML Technologien sollten so viel wie m glich Verwendung finden In die oben angesprochene Kombination von Java und Open Source Komponen ten der Apache Software Foundation ASF lassen sich XML Technologien geradezu ideal einpassen 2 4 5 Realisierungsm glichkeiten f r den HSSS In diesem Abschnitt sollen basierend auf der Aufgabenstellung sowie den Anforde rungen von DINI und Dissertationen Online die wichtigsten Anforderungen an den HSSS spezifiziert werden Dabei k nnen nicht alle von den genannten Institutio nen vorgeschlagenen Anforderungen in der w
240. istenzart sowohl in Dateiform hsssdata xml als auch innerhalb einer entsprechenden Da tenbanktabelle in der Spalte hsssdataxml der Tabelle conf ig_hssg vorkommen und ist immer in Verbindung mit der zugeh rigen Dokumentbeschreibungsdefinition DTD hsssdata dtd zu betrachten Die Konfigurationsstruktur enth lt Informa tionen die sich auf F higkeiten Funktionalit ten des HSSS als Ganzes beziehen Die folgende Aufz hlung nennt die wichtigsten Bereiche e lt HsssData LANGUAGES gt lt HsssData LANGUAGES gt Die vom HSSS unterst tzten Sprachen nach ISO639 2 Name Acronym Scheme e lt HsssData FORMATS gt lt HsssData FORMATS gt Die vom HSSS unterstiitzten Dokumenten Formate Name Extension Mime Typ e lt HsssData TYPES gt lt HsssData TYPES gt Die vom HSSS unterstiitzten Dokumentenarten lt HsssData TYPE gt z Bsp Be richt nebst zugeh rigen Dokumententypen lt HsssData SUBTYPE gt z Bsp For schungsbericht e lt HsssData TRANSMISSION gt lt HsssData TRANSMISSION gt Die vom HSSS unterstiitzten Ubermittlungsarten von Dokumenten z Bsp per URL E MAIL CD usw e lt HsssData UNIVERSITY gt lt HsssData UNIVERSITY gt Die vom HSSS unterstiitzte n Universit t en inklusive der Fakult tsstruktur lt HsssData Faculty gt e lt HsssData RIGHTS gt lt HsssData RIGHTS gt Die rechtlichen Bedingungen des HSSS Dokumentname Version URL e lt HsssData PU
241. it und Kryptographie in Java Addison Wesley 2000 Brett McLaughlin Java and XML O Reilly 2000 Alexander Nakhimovsky and Tom Myers Professional Java XML Pro gramming with Servlets and JSP Wrox 1999 Jennifer Niederst Web Design in a Nutshell O Reilly 1999 Bernd Oestereich Objektorintierte Softwareentwicklung Oldenbourg 1998 Larne Pekowsky JavaServer Pages Addison Wesley 2000 Eduardo Pelegr Llopart and Larry Cable JavaServer Pages Specification Version 1 1 Sun Microsystems Nov 1999 Dirk Riehle Muster f r Entwurfswerkzeuge Addison Wesley 1997 Lars R wekamp Java TagLibs entwickeln und einbinden Java Magazin 12 2000 und 01 2001 Peter Ro bach und Hendrik Schreiber Java Server und Servlets Addison Wesley 1999 J rgen Schmidt Dasein oder Nicht Dasein Analyse der Ausfallzeiten von Webservern c t HEISE 8 2000 Sebastian Schulz Webbasierte bergabe von Hochschulschriften an die SLUB ein Java basierter Dokumentenserver f r Hochschulschriften un ter Nutzung der Servlet JSP Technologie Gro er Beleg im Studiengang Informatik 2000 Richard Sietmann Von der Bibliothek ins Internet Die wissenschaftli chen Bibliotheken stecken in einer Finanzkrise ct HEISE 26 2000 Richard Sietmann Elektronisches Publizieren Public Domain oder Private Property DMV Mitteilungen 1 2000 Matthias Schulz Uwe M ller Burghard G ther
242. itel 231 A Metadatens tze des HSSS Bezeichnung BERSETZTER TITEL Beschreibung Eine Liste von bersetzten Titeln DC Bezeichnung DC Title Translated Parametername dc title translated Metadatentyp primary Regulation optional H ufigkeit 0 10 L ngenrestriktion 10 255 Tabelle A HSSS Metadatensatz Ubersetzter Titel A 2 2 DC CREATOR Bezeichnung NAME DES VERFASSERS Beschreibung Der Name eines Verfassers DC Bezeichnung DC Creator PersonalName Parametername dc_creator_personalname Metadatentyp primary Regulation mandatory H ufigkeit 1 10 L ngenrestriktion 8 60 Tabelle A5 HSSS Metadatensatz Name des Verfassers Bezeichnung GEBURTSDATUM DES VERFASSERS Beschreibung Das Geburtsdatum eines Verfassers DC Bezeichnung DC Creator PersonalName DateOfBirth Parametername dc_creator_personalname _dateofbirth Metadatentyp primary nicht genutzt Regulation optional H ufigkeit 0 10 L ngenrestriktion 10 50 Tabelle A6 HSSS Metadatensatz Geburtsdatum des Verfassers 232 A 2 Spezifikation der Metadaten Bezeichnung GEBURTSORT DES VERFASSERS Beschreibung Der Geburtsort eines Verfassers DC Bezeichnung DC Creator PersonalName PlaceOfBirth Parametername dc_creator_personalname_placeofbirth textbfMetadatentyp primary nicht genutzt Regulation optional H ufigkeit 0 10 L ngenrestriktion 4 255 Tabelle A7 HSSS Metadatensatz Geburtsort des Verfa
243. ittstelle bietet 103 3 Systemarchitektur verwendet siehe dazu auch die Beschreibung dieses API im Anhang in Abschnitt ab Seite 280 die Klasse JDOMParser fungiert f r die Gesamtanwendung als Wrapper und wird bei jedem Vorgang ben tigt der ein Einlesen bzw Parsen ei ner XML Ressource verlangt Am Ende des Parsens stellt die Klasse JDOMParser eine f r die Anwendung sehr gut auswertbare Repr sentation der XML Struktur dar ein JDOM Document aus welcher dann mit Hilfe der Klassen HSSSDataRetriever MetadataSetDataRetriever bzw AccessDataRetriever die eigentliche Objekt Re pr sentation erstellt wird Runnable PDFTransformer PDFTransformer xsIFile String ms M transform void run void MetadataSetTransformer transform xsIFile String ms Metadata transform xsIFile String xmlFile String transformPDF xsIFile String ms Meta transformPDF xslFile String xmlFile transformPDF foFile String String transformTofFile xslFile String ms Me transformToFile xslFile String xmlFilg JDOMParser parse uri String v boolean void parse uri StringReader v boolean printDocumentComponent compong HsssDataRetriever doc Document null ns Namespace Namespace getNai HsssDataRetriever doc Document supportedLanguages LanguageS supportedFormats FormatSet supportedDocumentTvpes Docum AccessDataRetriever doc Document null AccessDataRetriever doc Docume accessList Map MetadataSetDataRetriever d
244. itutionen entity name daf r ben tigt publisher id publisher name user und passwd Von der Anwendung wird f r den Exportvorgang f r jede Exporteinrichtung eine se parate Zustandskategorie eingerichtet M gliche Zust nde sind nicht bekannt Me tadaten exportiert Metadaten nicht exportiert und OK R ckmeldung Erfolgt ein Export an eine der Institutionen wird deren Exportzustand automatisch auf Me tadaten exportiert gesetzt Zus tzlich wird von der Anwendung der Export Zeitpunkt 148 5 1 Analyse und Design vermerkt Der Parameter delay gibt an wie viele Tage die SLUB Mitarbeiter des Referats 5 3 m glichst auf eine Export Best tigung von der betreffenden Institution warten sollen bevor sie den Metadatensatz endg ltig einstellen 1 lt xml version 1 0 encoding ISO 8859 1 gt 2 lt HsssData HSSSDATA xmlns HsssData http hsss slub dresden de xml HsssData gt Im lt HsssData EXPORT gt lt HsssData ExportEntity entity name ddb publisher id L60000589 publisher name slub target ep ddb de delay 14 user passwd xxxxxxxx gt lt HsssData ExportEntity entity name swb publisher id DDSU publisher name hsss target ftp bsz bw de daten opus DDSU opus_neu delay 14 user DDSU passwd xxxxxxxx gt 9 lt HsssData EXPORT gt 10 11 lt HsssData HSSSDATA gt o A o e Listing 8 Export Bereich der Konfigurationsstruktur hsssdata cml
245. jetzt auch f r diese Repr sentation der Ressource erweiterte Infomationen wie Schlagworte verf gbar sind 75 3 Systemarchitektur Auflage Repr sentation 1 Auflage Repr sentation 2 idn 100000 200 Mustermann Hans 320 Ein Titel 334 elektronische Ressource 418 Dresden 425 1999 433 Online Ressource II 144 S graph Darst 618 s Schlagwortl 21 3 Titelsatz Abbildung 12 Einheitliche Titelaufnahme einer Ressource Falls eine direkte Zusammenfassung technisch nicht m glich ist muss strikt zwi schen der Inhaltsbeschreibung der Ressource f r alle Repr sentationen gleich und der Repr sentationsbeschreibung f r jede Repr sentation unterschiedlich unterschieden werden Abbildung 13 zeigt eine L sungsm glichkeit f r diesen Fall Ressource Auflage Repr sentation 1 idn 100000 idn 900000 SS qid 100000 200 Mustermann Hans 334 elektronische Ressource 320 Ein Titel 433 Online Ressource Repr sentationssatz 418 Dresden Auflage Repr sentation 2 425 1999 idn 900001 gid 100000 334 618 s Schlagwortl 21 3 Ce 433 II 144 S graph Darst Titelsatz Repr sentationssatz Abbildung 13 Trennung von Inhalt Repr sentation Wie die Abbildung zeigt existiert zu jeder Ressource nur eine Beschreibung des Inhalts hier der MAB Datensatz mit der Identifikationsnummer 1000000 F r die 76 3 1 Gesch ftsmodelle und Arbeitsabl ufe unterschied
246. keine Parametername temp processingid Metadatentyp system Regulation mandatory H ufigkeit 1 1 L ngenrestriktion 10 100 Tabelle A45 HSSS Metadatensatz Bearbeitungsnummer Bezeichnung GESAMT BEARBEITUNGSSTATUS Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Gesamt Bearbeitungsstatus des Metadatensatzes auch nach au Ben sichtbar keine temp processingstate secondary mandatory 1 1 5 100 Tabelle A46 HSSS Metadatensatz Gesamt Bearbeitungsstatus 245 A Metadatens tze des HSSS Bezeichnung DOKUMENTEN BEARBEITUNGSSTATUS Beschreibung Bearbeitungsstatus des Dokuments DC Bezeichnung keine Parametername temp _documentstate Metadatentyp secondary Regulation mandatory H ufigkeit 1 1 L ngenrestriktion 5 100 Tabelle A47 HSSS Metadatensatz Dokument Bearbeitungsstatus Bezeichnung METADATEN BEARBEITUNGSSTATUS Beschreibung Bearbeitungsstatus der Metadaten des Metadatensatzes DC Bezeichnung keine Parametername temp _ metadatastate Metadatentyp secondary Regulation mandatory H ufigkeit 1 1 L ngenrestriktion 5 100 Tabelle A48 HSSS Metadatensatz Metadaten Bearbeitungsstatus Bezeichnung EXPORTINFORMATION DDB Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Informationen zum Metadatenexport an die DDB keine temp_ expor
247. ldsuchen und hebt sich dabei durch einen skalierbaren sehr performanten Indexaufbau gt vor welcher durch spezielle Strategien inkrementell genauso schnell ist wie im Batch Modus Dabei stellt Lucene nur mini male Anforderungen an Speicher und Hauptspeichei L LUb Lucene wird von einer Reihe von Entwicklern gepflegt und weiterentwickelt und h chstwahrscheinlich noch in diesem Jahr von der ASF Apache Software Foundation eine der gr ten Open Source Initiativen unterst tzt die damit ihr Portfolio im Bereich Web Services um ein interessantes Produkt bereichert Das API von Lucene verteilt sich auf mehrere Packages die jeweils getrennte Funktionsbereiche lose gekoppelt realisieren e com lucene util Dieses Package enth lt einige Hilfsklassen und Datenstrukturen etwa BitVector oder PriorityQueue Will mann allerdings auf die gesamte Beschreibung zugreifen muss diese durch Verbiinde erst wieder relativ aufwendig zusammengesetzt werden d h es existiert ein Zielkonflikt zwischen verschiedenen Zugriffsarten laut eigenem Datenblatt etwa 200MB Stunde auf einem Pentium 11 266MHz letwa 1MB Heap Dieser Schritt ist f r die Zukunft von Lucene sehr wichtig da somit gegen ber potentiellen Inte ressenten die Weiterentwicklung und die finanzielle Unterst tzung in einer ganz anderen Art und Weise glaubhaft versichert werden kann 186 6 2 Objektorientierte Analyse und Design com lucene store Dieses Package enth
248. le auch gemeinsam behandelt werden k n nen Aufgrund der hierarchischen Struktur der Dublin Core Metadaten und der Unter teilung in hnlich strukturierte Kategorien bestehen auch innerhalb von MetadataSet Dissertation bzw MetadatSetBericht immer wiederkehrende Strukturen Das auf der n chsten Seite abgebildete Listing A1 zeigt eine solche Struktur exemplarisch Das Attribut documenttype des u eren Tags beschreibt die Dokumentenart der Metadatensatzbeschreibung m glich sind also Dissertation und Bericht Danach folgt eine Iteration von 15 Element Tag zu denen jeweils die Tags ElementDCName Name der DC Kategorie ElementDescription Beschreibung der DC Kategorie ElementLabel Beschriftung der DC Kategorie innerhalb des MetadatenGenerators und SubElements geh ren Dieser letzte Tag enth lt alle selbstdefinierten Subele ments SubElement innerhalb der DC Kategorie Zu jedem SubElement existieren wieder beschreibende Tags so zum Beispiel Sub ElementDCName DC Name des Subelements welches zus tzlich die Attribute regu lation obligatorisches oder optionales Subelement und metadatatyp Prim r Meta daten Sekund r Metadaten oder System Metadaten besitzt SubElementDescription enth lt die Beschreibung des Subelements SubElementLabel die innerhalb des Meta datengenerators verwendete Beschriftung SubElementPaarameter gibt die Bezeich nung des HTTP Parameters an der die Information zu diesem Subelement enth lt
249. le pers_description Tabelle A68 die Tabelle pers_format Tabelle A69 die Tabelle pers_kindofdocument Tabelle A70 die Tabelle pers_language Tabelle A71 die Tabelle pers_person Tabelle A72 die Tabelle pers_publication Tabelle A73 die Tabelle pers_relation 245 245 245 246 246 246 247 247 247 248 248 261 261 262 263 264 265 265 265 266 266 267 267 267 267 268 268 268 268 269 15 Tabellenverzeichnis ER RER SEE SEE HERE 269 en ne Se oe 269 A er 269 kee ek ee 270 AA 270 EE a e ea oar 270 EE 271 A 271 EEE 272 FERN 272 RE 272 EE 273 ee 273 RER 273 ps 274 EE 274 16 Listings BEER EH ie ee Listing 4 formale XML Sirukhur eines Meladalensaze Listing 5 formale XML Struktur einer Metadatensatzbeschreibung Listing 6 grundlegende Struktur der Konfigurationsdatei web cml Listing 7 Einfaches Beispiel f r den Einsatz von TagLibs Listing 8 Export Bereich der Konfigurationsstruktur hsssdata cml EEE Bae an SES 17 Selbst ndigkeitserkl rung Ich versichere dass ich die Arbeit ohne fremde Hilfe und ohne Benut zung anderer als der angegebenen Quellen angefertigt habe und dass die Arbeit in gleicher oder hnlicher Form noch keiner Pr fungsbeh rde vor gelegen hat und von dieser als Teil einer Pr fungsleistung angenommen wurde Alle Ausf hrungen die w rtlich
250. legieren und geraten somit in keine Abh ngigkeit Singleton instance Singleton null Singleton Singleton factory getinstance sl E Abbildung 25 Klassendiagramm Singleton 105 3 Systemarchitektur Die Abbildung zeigt das Klassendiagramm des nur aus einer Klasse bestehen den Musters Singleton Entscheidend ist dass der Konstruktor Singleton als protected deklariert ist so dass von au en keine Instanzen dieser Klasse erstellt wer den k nnen Stattdessen ist der einzige ffentliche Zugriffspunkt ber getInstance gegeben Diese Methode liefert falls die Klasse schon instanziiert ist eine Referenz auf die einzige vorhandene Instanz bzw die Klasse ist noch nicht instanziiert erstellt ber den Konstruktor Singleton die einzige Instanz und liefert die Referenz interface Product Creator Factory lt Creator gt lt Product gt factoryMethod Product Abbildung 26 Klassendiagramm Fabrikmethode Die Abbildung 26 zeigt die formale Klassenstruktur des Entwurfsmusters Fabrik methode Die Klasse Factory ist dabei mittels der Erzeugermethode factoryMethod und anhand eines Diskriminators in der Lage ein durch den Diskriminator bestimm tes konkretes Objekt vom Typ Product zu instanziieren und zur ckzuliefern in die sem Fall entweder die Instanz von ProductA oder von ProductB Jede Klasse die ein bestimmtes Objekt vom Typ Produkt ben tigt w rde die Instanziier
251. les Zertifikat best tigt werden kann Voraussetzung daf r ist die Aufr stung der Dokumentenserver und Webserver auf sichere Kommunikationsprotokolle z Bsp SSL zur verschl sselten bertragung von Inhalten Der Bereich Langzeitarchivierung wird in den Empfehlungen besonders ausf hrlich behandelt da es hier nach wie vor viele Problemstellungen gibt die auch schon im Abschnitt 2 4 auf Seite 36 angesprochen wurden Zu den von der Arbeitsgruppe ange sprochenen Problemfeldern z hlen die Hardwarekomponenten die Metadaten f r die Archivierung die Speicherung der Daten sowie Gesch ftsmodelle f r die Steuerung und berwachung der Archivierungsabl ufe Zum Themenbereich Hardwarekomponenten und konzepte hat das NEDLIB Projekt der Europ ischen Kommission die Fragen der Langzeitarchivierung vor allem aus dem Blickwinkel der beteiligten europ ischen Na tionalbibliotheken untersucht Zu den Ergebnissen dieses Projektes geh ren u a ein generisches Funktionsmodell f r die Archivierung digitaler Publikationen Strategien f r die Langzeitverf gbarkeit digitaler Objekte sowie ein Datenmodell f r langzeitar chivierungsrelevante Metadaten Diese Erkenntnisse sollen an den Nationalbibliothe ken so auch an der Deutschen Bibliothek DDB umgesetzt werden Aber auch f r gr ere lokale Archive anderer Institutionen lohnt sich ein Blick auf diese Ergebnis se F r die Archivierungsmetadaten empfiehlt die Arbeitsgruppe das Referenzmodell O
252. lichen Merkmale der Repr sentationen m ssen separate Datens tze mit eigenen Identifikationsnummern erstellt werden die aber alle auf dieselbe Inhaltsbe schreibung verweisen ber qid auf den MAB Datensatz mit der Identifikationsnum mer 100000 Informationstechnisch gesehen w re eine einheitliche Quellenbeschreibung egal ob mit oder ohne Auslagerung der Repr sentationsinformationen einer Ressource ein gro er Fortschritt In der Praxis sind dazu mit Sicherheit einige Hindernisse zu berwinden Angesichts der zunehmenden Verlagerung der Publizistik in den elek tronischen Bereich und den zunehmend zu erwartenden Dopplungen sollte eine solche Umstellung jedoch nicht in allzu ferne Zukunft verschoben werden erste Bem hun gen in diese Richtung sind zum Teil auch schon unternommen worden so hei t es beispielsweise in SWB00 dass bei parallelen Ausgaben in der Titelaufnahme der konventunellen Ausgabe einen Link auf die Online verf gbare Version zu setzen was allerdings nicht ausreicht Zum Aufwand einer solchen Umstellung kann an dieser Stelle keine Aussage getroffen werden da der Autor mit dem entsprechenden biblio thekarischen Einzelheiten zu wenig vertraut ist Fakt ist aber dass die g ngige Praxis f r jede Repr sentation oder Auflagd einer Ressource eine neue Titelaufnahme zu erstellen informationstechnisch betrachtet schlicht und einfach falsch ist 14Dje Aussage trifft nur f r unver nderte Auflagen zu ge
253. lle nicht formal bewiesen wird Durch die Unterst tzung dieser Forderungen durch das Datenbankschema kann das Gesamtsystem bei der Schaffung und Erhaltung konsistenter stabiler und nicht redundanter Anwendungsdaten optimal unterst tzt werden obwohl dieser Vorteil mit der Partitionierung der Daten ber relativ viele Relationen erkauft wird Die Partitio nierung h lt sich allerdings im Rahmen und soll durch die Forderung nach Minimalit t des Datenbankschemas so weit es m glich ist begrenzt werden Im Folgenden soll das Datenbankschema anhand von drei haupts chlich auftreten den Strukturen n her erl utert werden wobei allerdings nicht jede Relation einzeln betrachtet werden kann Eine bersicht aller Relationen bzw Tabellen sowie eine Auflistung aller Attribute und Besonderheiten der jeweiligen Tabellen befindet sich im Anhang Die Zentrale Relation des Datenbankschemas beinhaltet Informationen die sich einem Metadatensatz eindeutig zuordenen lassen Diese Relation ist in jeder der drei nachfolgend betrachteten Strukturen enthalten und und ist folgenderma en aufgebaut pers_metadataset id processingid identifier_virtual identifier_real language_id type_id publisher_id contributor_id rights_id Aus diesem Aufbau wird die erste der innerhalb des Schemas h ufig auftretenden Strukturen bereits deutlich Es handelt sich hierbei um 1 1 Beziehungen des Metada tensatzes zu anderen Relationen wie formal in Abbildung 49 dargestellt
254. llector zur ck Dieses Objekt wird vom RequestResponseManager der AccessTools der Session als Attribut hinzugef gt und ist somit auch innerhalb der View durch die entsprechenden JSP s verf gbar Dabei wird eine Strategie verfolgt die eine besonders ressourcenschonende und performante Realisierung der Suche so wie der Teilmengenbildung erlaubt Dazu wird am Ende der Suche der Konstruktor der Klasse HsssHitCollector mit dem Suchergebnis Objekt vom Typ Hits und der aktuellen Teilmengengr e aufgerufen Der HsssHitCollector legt das Hits Objekt intern als Attribut ab Zus tzlich existieren Attribute die das Navigieren innerhalb der einzelnen Teilmengen erlauben die den Detaillierungsgrad der Ergebnisrepr sentation bestimmen und die als Datencontainer f r bereits gelieferte Teilergebnisse fungieren Die View ruft nun die zentrale Methode getPageSet auf welche die erste Teil menge liefert oder auch die gesamte Ergebnismenge Diese Methode ist im Listing 10 auf der folgenden Seite abgebildet Mit dem innerhalb des HsssHitCollector ent haltenen Hits Objekt stehen lediglich die Rangnummer die Wertigkeit score und eine Referenz auf das jeweilige Dokument f r die einzelnen Treffer der Ergebnismen ge zur Verf gung Insbesondere bei gro en Treffermengen w re es ineffizient sofort alle sich in den Dokument Referenzen verbergenden Informationen in entsprechende Datenstrukturen abzulegen Ein solches Vorgehen ist aus dem Grund problema
255. lte Klasse TimeHit erm glicht Ein Klick auf das Symbol des durchgestrichenen Notizzettels welches zu jedem gesammelten Treffer angezeigt wird entfernt diesen wieder aus der Trefferliste Die integrierte Komponente der gesammelten Treffer kann ebenso wie die Komponenten f r die Suchen und die Hilfe in einer Einzel Ansicht gezeigt werden welche durch das Klicken der aufw rtsgerichteten Pfeile bei Meine Treffer erreicht wird Im Folgenden soll noch einmal die Trefferanzeige bei Suchen n her erl utert werden dazu dient die in Abbildung 61 ausschnittsweise gezeigte Ergebnismenge einer Volltextsuche ges SLUB AccessTools Microsoft Internet Explorer Dace Bastelen Ansicht Eegen Extras 2 CS EE a 3 8 8 Vorwarts echen Aktualieren Startseite Suchen Favoriten Verlauf E Mail Drucken Bearbeiten eer http hsss slub dresden de hsss myhsss fulltext_wrapper jsp Wechseln zu l Links J Volltextsuche ES Suchen R cksetzen nur Volltext nur Felder Felder und Volltext T detailierter Report Ergebnisgr e Datum von bis 38 Treffer gefunden zeige Treffer 1 bis 10 zur ck 1 2 3 4 weiter la Seite 1 E 1 Dissertation Die Berechnung von Struktur Energetik und kemmagnetischen Abschirmungen von Fullerenen und ihren Derivaten P4 Autor Thomas Heine Datum 27 03 1999 Dissertation Modeling and computer simulation of ion bea
256. ltextsuchmaschine die sich durch ein sauberes objektorientiertes Design eine flexible Indizierungsstrategie und durch eine gute Integrationsf higkeit auszeichnet e Einsatzbereich innerhalb des Gesamtsystems Lucene wird im Rahmen des Gesamtsystems innerhalb der dritten Teilanwen dung f r die Volltextsuche und f r die Feldsuche verwendet D 2 5 Xerces e Produktname Xerces Java Parser e Version 13 e Homepage http xml apache org xerces j index html e Beschreibung Bei Xerces handelt es sich um einen javabasierten XML Parser der alle XML 1 0 Empfehlungen des W3C unterst tzt Zus tzlich unterst tzt dieser Parser die Industriestandards DOM Level 1 und SAX Version 1 sowie einige erweiterte Parser Funktionalit ten wie XML Schema DOM Level 2 und Sax Version 2 Xerces wird ebenfalls von der ASF entwickelt e Einsatzbereich innerhalb des Gesamtsystems Xerces wird f r alle XML Parsing Vorg nge des Gesamtsystems in Verbindung mit JDOM verwendet also insbesondere im Zusammenhang mit den XML basierten Konfigurationsstrukturen D 2 6 Xalan e Produktname Xalan Java 2 e Version 2 0 1 279 D Verwendete Technologien Produkte e Homepage http xml apache org xalan j index html e Beschreibung Xalan ist ein XSLT Prozessor der es erm glicht XML Dokumente in Text HTML oder andere XML Dokumententypen zu transformieren Xalan imple mentiert die W3C Empfehlungen f r XSLT und XPath und kann auf
257. m synthesis of nanostructures 24 Autor Matthias Strobel Datum 11 11 1999 3 Dissertation Klassische und Quantendynamik periodisch getriebener chaotischer Streusysteme 24 Autor Michael Henseler Datum 18 08 1999 4 Dissertation Approximative Proze modellierungen in der empirisch erziehungswissenschaftlichen Forschung y maoa E Fertig gh Internet Abbildung 61 myHSSS Teilergebnis einer Volltextsuche 2Tganz nach unten rutschen 202 6 3 Realisierung Wie in Abschnitt bereits angedeutet wird das Gesamtergebnis auf mehrere Teilergebnisse Seiten aufgeteilt wenn es eine bestimmte Trefferzahl bersteigt Oberhalb und unterhalb der jeweils angezeigten Treffer befindet sich deshalb eine Navigationsleiste welche die gezielte Anzeige bestimmter Teilergebnisse bzw Seiten durch das Klicken auf zur ck weiter oder die jeweilige Seitennummer erm glicht Au erdem werden die Gesamttrefferzahl genannt sowie die Nummern der innerhalb der aktuellen Seite angezeigten Treffer Jeder Treffer wird innerhalb eines eigenen visuell abgegrenzten Bereichs pr sentiert Auf der linken Seite befinden sich jeweils die Statusinformationen eines Treffers so zum Beispiel dessen Nummer innerhalb des Gesamtergebnisses und dessen Wertigkeit Darunter befindet sich das Notizzettel Symbol welches beim Anklicken zur Speicherung des jeweiligen Treffers in der Menge der gesammelten Treffer f hrt
258. metadataset id publication_id references pers_publication id unique metadataset id publication id Tabelle A86 die Tabelle pers_publication_metadataset pers_relation_metadataset Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle type varchar 100 vi Typ der Relation intern extern metadataset_id numeric 6 y Metadatensatz Fremdschl ssel relation_id numeric 6 Y Relation Fremdschliissel metadataset_id references pers_metadataset id relation_id references pers_relation id unique metadataset id relation id Tabelle A87 die Tabelle pers_relation_metadataset 273 C Datenbank Schema des HSSS pers_subject_metadataset Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle type varchar 100 WJ Typ des Subjects Schlagwort eigene SWD Klassifikation DNB RVK metadataset_id numeric 6 y Metadatensatz Fremdschl ssel subject_id numeric 6 y Subject Fremdschl ssel metadataset_id references pers_metadataset id subject_id references pers_subject id unique metadataset id subject id Tabelle A88 die Tabelle pers_subject_metadataset pers_title_metadataset Name DATENTYP BESCHREIBUNG IP M id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle type varchar 100 y Art des Titels Originaltitel alternati
259. mlns HsssData http hsss slub dresden de xml HsssData gt Ba unterst tzte Sprachen gt lt HsssData LANGUAGES gt lt HsssData LANGUAGE gt lt HsssData LanguageName gt Deutsch lt HsssData LanguageName gt lt HsssData Languagedcronym scheme IS0639 2 gt ger lt HsssData LanguageAcronym gt lt HsssData LANGUAGE gt lt HsssData LANGUAGE gt lt HsssData LanguageName gt Abbildung 48 HSSS Admin Tools Konfigurationsstrukturen Durch die Aktion Stylesheets wird ein der vorigen Abbildung hnliches Formular pr sentiert welches ebenfalls nur Administrations Nutzern zug nglich ist Hier k nnen alle in der Anwendung genutzten XSL Stylesheets angezeigt ge ndert und gespeichert 2080 w rde beispielsweise die Erweiterung der unterst tzten Sprachen in der Konfigurationsstruk turhsssdata xml um eine neue Sprache nach der Aktivierung von Reload auch in bereits par allel laufenden Instanzen des MetadatenGenerators sichtbar 164 5 2 Realisierung werden Dies hat den gro en Vorteil dass zur Laufzeit zahlreiche nderungen m glich sind die ansonsten Programm nderungen ein erneutes Kompilieren und Deployment sowie das Neustarten der beteiligten Systemkomponenten erfordern w rden So lassen sich nderungen im Hinblick auf neue Anforderungen an die Export Formate f r DDB Die Deutsche Bibliothek und SWB S dwestdeutscher Bibliotheksverbund durchf h ren au erdem lassen sich d
260. n Beeinflusst Benennung von Parametern Tabelle 3 Einflussm glichkeiten der Metadatensatzbestandteile Selbstverst ndlich muss der Metadatensatz in einer geeigneten Art und Weise strukturiert bzw beschrieben sein um der Anwendung die genannten Informatio nen zur Verf gung stellen zu k nnen Hier eignet sich wieder XML ausgezeichnet um den Metadatensatz in einer der Anwendung bekannten Struktur zu definieren und anschlie end von dieser eingelesen und in eine interne Repr sentation umgewandelt zu werden Listing 5 zeigt eine m gliche Struktur einer solcherart in XML formulierten Metadatensatzbeschreibung 197 Bsp ein Stern f r obligatorische Elemente oder eine besondere Farbe 20F r obligatorische Elemente muss z Bsp von der Anwendung die Einhaltung der Untergrenze 1 garantiert werden 84 3 2 Architekturtibersicht 1 lt xml version 1 0 encoding ISO 8859 1 gt 2 lt metadataset documenttype gt 3 lt dc element gt 4 lt name gt lt name gt 5 lt param gt lt param 6 SR 7 lt dc subelement gt 8 lt name gt lt name gt 9 lt param gt lt param gt 0 Ree 11 lt dc subelement gt 12 Ne 3 lt dc element 4 GN 15 lt temp gt 16 lt temp element gt 7 lt name gt lt name gt 8 lt param gt lt param 19 se 20 lt temp element gt 21 Gg 22 lt temp gt 23 lt metadataset gt Listing 5 formale XML Struktur eine
261. n und Bericht ableiten Welche dieser bei den Klassen instanziiert wird entscheidet die Klasse MetadatSetFactory anhand der Wahl des Autors im MetadatenGenerator Diese Klasse realisiert zugleich die Ent wurfsmuster Singleton und Fabrikmethode Jede Instanz vom Typ MetadataSet ab Seite n her beschrieben wird 126 4 1 Objektorientierte Analyse und Design enth lt eine Referenz auf ein Objekt vom Typ MetadataValidator bzw dessen Spe zialisierungen MetadataValidatorGeneric MetadataValidatorDissertation oder MetadataValidatorBericht welche zur Validierung des Metadatensatzes der jewei ligen Dokumentenart verwendet werden Dazu enthalten diese Klassen Validierungs informationen ber die einzelnen Elemente bzw Sub Elemente des Metadatensatzes welche aus der entsprechenden Metadatensatzbeschreibung gewonnen werden Ob jekte vom Typ MetadataValidator haben daher Zugriff auf ein Objekt vom Typ MetadataSetData welches die Konfigurationsstruktur der Metadatensatzbeschreibung repr sentiert also je nach Dokumentenart MetadataSetDissertation xml oder MetadataSetBericht xml Die Schnittstellenimplementierung GenericMetadata SetData repr sentiert dabei eine Metadatensatzbeschreibung f r die Dokumentenart Bericht die Spezialisierung DissertationMetadataSetData eine Metadatensatzbe schreibung f r die Dokumentenart Dissertation welche eine Obermenge der erstge nannten ist Ein Objekt
262. n Auf der Clientseite entstand mit der Umsetzung der dritten Architekturvision ein interessan tes vom Nutzer skalierbares Design welches sich durch ein zus tzlich implementiertes JSP Komponentenkonzept sehr flexibel gestalten l sst Als letztes konnte mit der Implementation des OAI Protokolls eine Anbindung des HSSS an andere OAI Archive realisiert werden so dass der Dokumentenserver national und international im Sinne eines OAI Data Provider genutzt werden kann Dar ber hinaus entstanden in Zusammenarbeit mit den beiden Auszubildenden eine Reihe von Dokumentationen u a zu den Konfigurationsstrukturen zum MetadatenGenerator zur Hilfe des MetadatenGenerators und zu System und Installationsanforderungen des HSSS 221 8 Zusammenfassung und Ausblick 8 2 Verbesserungsm glichkeiten Dieser Abschnitt soll die vielen Hinweise zu Verbesserungsm glichkeiten die im Ver lauf dieser Arbeit gemacht wurden noch einmal systematisch zusammenfassen Dabei werden die Verbesserungen und Erweiterungen in solche eingeteilt die sich generisch auf das Gesamtsystem beziehen und in solche die den einzelnen Teilanwendungen zuordenbar sind Wenn eine Verbesserung respektive Erweiterung bereits explizit in einem vorangegangenen Abschnitt beschrieben wurde wird sie in dieser Zusammen fassung nur noch einmal kurz genannt und an die entsprechende Stelle verwiesen 8 2 1 Verbesserungsm glichkeiten des Gesamtsystems e Eine erste Form der Erw
263. n Model fun giert F r die Java ServerPages in Schicht 1 hat das den Vorteil dass sie haupts chlich nur f r das Layout also f r die Darstellung bestimmter Sachverhalte verantwortlich sind So werden die einzelnen Anwendungsschwerpunkte relativ sauber voneinander getrennt weshalb dieser Architekturansatz auch f r gr ere Webanwendungen pr des tiniert ist Aufgrund dieser Tatsache wurde dieser Ansatz bereits w hrend des Belegs f r die Realisierung der einzelnen Teilanwendungen Webanwendungen des HSSS ge w hlt und wird auch im Diplom beibehalten Schicht 1 View ie Schicht 3 Model Schicht 2 Controller Anfrage p d Gesch fts i objekte JSP Servlet i Antwort JSP Abbildung 29 Architektur dispatcher approach MVC Auf die Architekturdetails der Client Ebene hat diese Entscheidung insofern Ein fluss als damit das Aufgabengebiet der Client Seite klar abgegrenzt wird e Die Client Seite der Webanwendungen des HSSS fungiert als View innerhalb des Architekturansatzes dispatcher approach e Das bedeutet dass die entsprechenden JSP s in der Regel nur layoutspezifische Aufgaben realisieren e Der Anteil von Scriptlets innerhalb der JSP s ist deshalb soweit wie m glich zu minimieren 109 3 Systemarchitektur Bei Beachtung dieser Vorgaben ist auf der Client Seite eine Implementation m g lich die nahezu alle Interna der Anwendung wie Flusskontrolle Wissen
264. n die durch unterschiedliche t 3 q 1 Dissertation Translationsaktivatoren der mitochondrialen Cytochrom b Synthese in Saccaromyces potros ner ee meta 20 cerevisiae Membranassoziation Mutagenese und Protein Wechselwirkungen von Cbsip immer gro geschrieben werden Meine Treffer E Autor Udo Krause Buchholz AHD alle eingegebenen Begriffe D m ssen in mind einem Dokument 3 Treffer Datum 1002000 vorhanden sein weitere Titel Z B Ampeln AND Wildbahn HSSS Beschreibung Die vorliegende Arbeit besch ftigt sich mit Cbslp und Cbs2p zwei spezifische OR die eingegebenen Begriffe S Translationsaktivatoren der COB mRNA Im Mittelpunkt standen sowohl die weitere k nnen in mind einem Dokument SLUB molekularbiologische und biochemische Charakterisierung von Cbs1p als auch ein Screening von vorhanden sein TU Dresden Interaktionskandidaten die mit Cbslp und oder Cbs2p physikalisch wechselwirken k nnten Cbslp liegt Z B Regen OR Wasser AAA als peripheres Membranprotein fest mit der inneren Mitochondrienmembran matrixseitig assoziiert vor MOT alle eingebenen Begriffe d rfen Dabei spielen m glicherweise hydrophobe und oder Protein Protein Wechselwirkungen mit integralen in keinem Dokument vorhanden sein Membranproteinen eine essentielle Rolle bei der Membranverankerung von Cbslp Durch die Z B Selters NOT Mineralwasser Identifizierug von atmungsdefekten Cbs1p Mutanten deren Mutationen in Bereichen mit Homologie zu gt Trunkiert
265. n Formulare eingetragen wird ihm noch einmal eine bersicht aller Eingaben pr sentiert wie sie in Abbildung 37 auf der folgenden Seite dargestellt ist lOEinlesen der entsprechenden Metadatensatzbeschreibung erstellen der korrekt spezialisierten In stanzen durch entsprechende Fabriken usw 131 4 Teilanwendung 1 MetadatenGenerator A f r Prof Dr Eberhard D lfer r Rainer Bergmann te Entwicklungsorientiertes Management orte Cultural Diversity Abbildung 37 SLUB MetadatenGenerator bersicht Die Pr sentation der Metadaten erfolgt geordnet nach den einzelnen Formula ren Seiten Der Autor kann jederzeit Ver nderungen vornehmen da jedes einzelne Subelement verlinkt ist und ihn beim Anklicken direkt auf das entsprechende Formular bringt Auch Texte die aufgrund des begrenzten Platzes dieses Formulars nicht kom plett dargestellt werden k nnen sind ber entsprechende Zusatzaktionen z Bsp den Klick auf ein Symbol vollst ndig verf gbar In einem weiteren hier nicht abgebildeten Formular muss sich der Autor mit den rechtlichen Bedingungen des HSSS einverstan den erkl ren und kann einige pers nliche Informationen E Mail Telefonnummer etc f r die SLUB Mitarbeiter hinterlassen Ein nochmaliger Klick auf Weiter f hrt auf der Server Seite dazu dass noch einmal alle Metadaten des Autors auf Vollst ndig keit berpr ft werden Konnte diese berpr fung erfolgreich a
266. n Punkten Performance und Skalierbarkeit m glichst gering gehalten werden sollten Im Falle des HSSS ist die Anwendung die die Abbildung realisiert das Servlet MappingServlet im Package urlmapping Dieses Servlet erh lt wie alle anderen Servlets des Gesamtsystems durch die Konfigurationsdatei web xml wichtige Konfigurationsprameter Die Abbildung 52 auf der folgenden Seite zeigt den groben Ablauf einer URL Abbildung innerhalb des HSSS so w re es von Vorteil wenn die Abbildung zu einer kontextbasierten hierarchischen Struktur f hren w rde so dass eine relative Streuung innerhalb der einzelnen Hierarchiestufen in Abh ngigkeit von bestimmten Eigenschaften der Ressource eintritt W hrend eine in etwa gleichverteilte Streuung relativ einfach durch verschiedene modulo Operationen in Verbindung mit Primzahlen erzeugt werden kann z Bsp timestamp mod 3 in der ersten Hierarchiestufe timestamp mod 5 f r die zweite usw ist eine kontextbasierte Streuung weitaus schwieriger weil die Information schon zum Zeitpunkt der Generierung der Bearbeitungsnummer in diese integriert werden m sste vorstellbar bei Verzeichnisstrukturen wie 2 4 6 22342342izuiziuhn234 0 2 1 98344564qxcweeiu963 usw die keine inhaltlichen Bezugspunkte bieten 181 6 Teilanwendung 3 HSSS AccessTools myHSSS web xml Thread UrlMapper Ka periodisch a Abbildung 52 Vorgang der URL Abbildung Beim ersten Zugriff auf das Servle
267. n des OAI Protokolls die es erlaubt dass der HSSS gegen ber anderen OAI Archiven als Data Provider auftreten kann Hier werden vor allem die Besonderheiten der Realisierung betrachtet die ber eine Minimalumsetzung des Protokolls hinausgehen Im letzten Kapitel erfolgt eine Zusammenfassung und eine Einsch tzung der Er gebnisse die im Laufe der Diplomarbeit realisiert werden konnten Dabei bezieht sich die Einsch tzung auf die Kapitel 2 bzw 3 aufgestellten Anforderungen respektive Ar chitekturvisionen In einem weiteren Abschnitt dieses Kapitels werden m gliche Ver besserungen bzw Erweiterungen des Gesamtsystems in einer strukturierten Art und 25 1 Einf hrung Weise vorgestellt Abschlie end erfolgt ein Ausblick der die weiteren Entwicklungs und Einsatzm glichkeiten sowie die Pr missen vorstellt die aus Sicht des Autors not wendig sind um die bisher erzielten Ergebnisse in eine stabile Produktivversion zu berf hren Im Anhang der Diplomarbeit finden sich Informationen zu den Metadatensatzspe zifikationen zu den Konfigurationsstrukturen sowie zum Datenbankschema des HSSS Au erdem ist eine kurze Auflistung der wichtigsten externen API s bzw Technologien enthalten die in das Gesamtsystem des HSSS integriert wurden 26 2 Aufgabenstellung Grundlagen Arbeitsabl ufe Inhalt des Kapitels 2 1 Aufgabenstellung der Diplomarbeit 28 2 2 Interpretation der Aufgabenstellung
268. n des zweiten Ansatzes tat s chlich ausfallen Allerdings d rfte eine Umstellung des Systems nicht ganz trivial sein da sie h chstwahrscheinlich in einen Bereich vorst tP der nicht umgestellt wer den darf bereits ver ffentlichte absolute URL s Deshalb m sste eine zuk nftige Ab bildung in diesem Fall beide Versionen der absoluten URL an einem ausgezeichneten Merkmal erkennen und unterschiedlich mit dem jeweils passenden Abbildungsansatz abbilden dann n mlich wenn sich die Struktur der absoluten URL ndern muss z Bsp infolge einer nde rung der Bearbeitungsnummern 184 6 2 Objektorientierte Analyse und Design 6 2 Objektorientierte Analyse und Design Die dritte Teilanwendung soll die Suche und die Navigation innerhalb der Metadaten s tze und m glichst auch innerhalb des Volltextes der Hochschulschriften des HSSS erm glichen sowie die Darstellung der Ergebnisse realiseren Die Suche und die Navi gation sind dabei auf drei verschiedene Arten realisierbar e Direkt innerhalb der Datenbank ohne zus tzliche Hilfsmittel Dieser Ansatz ist der am schwierigsten zu realisierende zumindest wenn die Suche einigerma en effizient und mit einer brauchbaren Performance erfolgen soll Insbesondere verlangt dieser Ansatz ein auf die Suche abgestimmtes Schema Die Volltextsuche ist nur sehr eingeschr nkt realisierbar e Innerhalb der Datenbank unterst tzt durch zus tzliche Datenbank funktionalit ten Vi
269. n k nnten Cbsip liegt als peripheres Membranprotein fest mit der inneren Mitochondrienmembran matrixseitig assoziiert vor Dabei spielen m glicherweise hydrophobe und oder Protein Protein Wechselwirkungen mit integralen Membranproteinen eine essentielle Rolle bei der Membranverankerung von Cbs1p Durch die Identifizierug von atmungsdefekten Cbsip Mutanten deren Mutationen in Bereichen mit Homologie zu RNA bindenden Proteinen liegt verst rken sich die Hinweise zur Beteiligung von Cbs1p an der direkten physikalischen Wechselwirkung mit dem 5 leader der COB mRNA Dar ber hinaus konnte gezeigt werden dass die abspaltbare Pr sequenz nicht notwendig f r einen E Fertig e Internet Abbildung 58 myHSSS Feldsuche in der Einzel Ansicht 199 6 Teilanwendung 3 HSSS AccessTools myHSSS Die verschiedenen Formulare f r die Suchen und die kontextsensitive Hilfe sind jeweils als separate JSP s realisiert die in andere JSP s unter bestimmten Vorausset zungen integriert werden k nnen So lassen sich Teile von myHSSS in verschiedenen Kontexten darstellen die integrierten JSP s sind sozusagen View Komponenten die sich relativ flexibel wiederverwenden lassen Die in Abbildung 58 gezeigte alleinige Integration der Feldsuche wird durch das Klicken auf die aufw rtsgerichteten Pfeile in der horizontalen Befehlsleiste des myHSSS siehe Abbildung 57 erreicht Will man wieder zur integrierten Ansicht vo
270. n myHSSS zur ck klickt man auf zur ck bzw auf die nach unten gerichteten Pfeile So kann man zwischen einer alles um fassenden Gesamtansicht und einer auf das Wesentliche reduzierten speziell auf die augenblickliche Aktion konzentrierten Ansicht hin und her wechseln Dies ist insbe sondere bei kleinen Bildschirmaufl sungen von Vorteil und kann besonders am Beispiel der kontextsensitiven Hilfe demonstriert werden Im Vergleich zu der in Abbildung 57 gezeigten Ansicht der Hilfe der nicht viel Platz zur Verf gung steht und die nur f r einen schnellen berblick genutzt werden sollte ist die in Abbildung 59 allein pr sentierte Hilfe aufgrund der ge nderten Platzverh ltnisse wesentlich bersichtlicher und k nnte auch f r umfangreichere Nachforschungen genutzt werden SLUB AccessTools Microsoft Internet Explorer Bisi x Datei Bearbeiten Ansicht Favoriten Extras 2 N E a ua 9 Zu 4 M Zur ck owas Abbrechen Aktualisieren Startseite Suchen Favoriten Verlauf E Mail Drucken Beatbeiter AAA Adresse kttp b00102 slub dresden de hsss myhsss help_wrapper isp Wechseln zu Links gt y zuriick y Feldsuche Hilfetext gt Titel Titel des Dokuments gt Autor Autor des Dokuments 3 Beschreibung Beschreibung des Metadatensatzes 3 Schlagworte Schlagworte die im Metadatensatz vorhanden sind HINWEIS In allen oben genannten Feldern kann der Platzhalter xxx eingetragen werden um alle verf gba
271. n zu erstellen Zu einem anderen Teil steht er in einem engen Zusammenhang mit dem Datenbankschema da dieses durch ein bestimmtes Design Normalisierungen referentielle Integrit t konsistente Daten sogar bis zu einem bestimmten Grad erzwingen kann Der dritte Punkt geht ber den zweiten noch hinaus indem durch die Forderung nach nicht redundanten Strukturen bestimmte Anomalie verhindert werden sollen Aus den drei beschriebenen Anforderungen ergibt sich als entscheidendes Entwurfs prinzip des Datenbankschemas die weitestgehende Normalisierung der Relationen um funktionale Abh ngigkeiten und damit m gliche Anomalien zu vermeiden Ein erster 21 Allerdings mit Ausnahme der tempor ren Metadaten die nur w hrend der Bearbeitung des Me tadatensatzes erforderlich sind und die nicht in die persistente Datenbasis des Gesamtsystems bernommen werden sollen 22 Hier spielen insbesondere Update Anomalien eine entscheidende Rolle 166 5 3 Persistenzrealisierung Schritt besteht dabei in der Unterst tzung der ersten Normalform die lediglich atoma re Attribute in den Relationen erlaubt Auch die zweite Normalform soll durch das Datenbankschema vollst ndig unterst tzt werden so dass keine partiellen Abh ngig keiten zwischen Schl sseln des Relationenschemas und weiteren Attributen bestehen Auch die dritte Normalform die transitive Abh ngigkeiten beseitigt wird von dem Datenbankschema unterst tzt wenngleich es an dieser Ste
272. nbank Schema zu entwickeln welches insbeson dere auch den Anforderungen der dritten Teilanwendung gen gt Au erdem ist die sogenannte Frontdoor automatisch zu erstellen sowie das Dokument entsprechend einzustellen Besondere Aufmerksamkeit gilt der geforderten Abbildung einer absolu ten sich nie mehr ndernden URL auf eine reale im Nachhinein noch ver nderbare URL Diese Abbildung ist auf verschiedenen Wegen realisierbar auf jeden Fall aber ein wichtiger Teil der Anwendung da jeder Zugriff auf eine Ressource des HSSS auch eine solche Abbildung verlangt Als dritte Teilanwendung ist schlie lich eine Applikation zu realisieren welche den Zugriff auf die persistenten Daten erm glicht Dieser Zugriff k nnte durch strukturier te Listen Suchm glichkeiten wie etwa die Feldsuche oder Volltextsuche beziehungs weise durch Navigationsverfahren realisiert werden Treffer sollten immer in Form der oben angesprochenen absoluten URL pr sentiert werden erst der direkte Zugriff erfolgt ber eine Indirektion auf die reale URL Volltextsuche und Feldsuche k nn dies gilt insbesondere f r Arbeitsabl ufe bei denen externe Institutionen involviert sind 3M sglicherweise handelt es sich bei diesem Teil der Anwendung um einen Flaschenhals der Gesamt anwendung 31 2 Aufgabenstellung Grundlagen Arbeitsabl ufe ten durch eine in die Datenbank integrierte Volltext Suchmaschine realisiert werden sofern diese vorhanden ist Andern
273. nd insbesondere deren OAI Protokoll Hierbei handelt es sich wie bereits gezeigt wurde um ein schlankes aber wirkungsvolles und in der Praxis leicht umsetz bares Protokoll welches mittelfristig dazu f hren k nnte den Suchraum in bezug auf wissenschaftliche Publikationen von einzelnen Archiven auf eine beliebige Menge lose gekoppelter dezentraler Archive auszuweiten Leider ergibt sich aus diesem Positivum der dritte Kritikpunkt der nach Meinung des Autors in der zu langsamen Umsetzung aktueller Entwicklungen besteht So sind viele Entwicklungen und Dokumentationen 24also andere Auszeichnungsformate o die zum Beispiel f r die Archivierung oder interaktive Online Pr sentationen usw genutzt werden k nnen 59 2 Aufgabenstellung Grundlagen Arbeitsabl ufe technisch nicht auf dem Stand der Zeit Bei dem betrachteten Gebiet handelt es sich um ein Gebiet welches besonders intensiv technischen Ver nderungen unterworfen ist Das verlangt entsprechend schnelle Reaktionen und damit insbesondere die schnelle Umsetzung aktueller Standards Die Realit t sieht leider anders aus So hat zum Beispiel die DINI bereits im September 2000 in ihrem Appell dazu aufgerufen das OAI Protokoll zu unterst tzen Gleichzeitig erkl rte sich die DINI dazu bereit diesen Prozess unterst tzend zu begleiten und zu f rdern Eine erste Informationsveranstal tung fand aber erst ein dreiviertel Jahr sp ter am 18 Juni 2001 statt So ist es nicht ver
274. nderte Auflagen machen gegebenenfalls auch eine erneute Titelaufnahme notwendig 77 3 Systemarchitektur 3 2 Architektur bersicht In diesem Abschnitt soll die Gesamtarchitektur des HSSS auf einem relativ hohem Abstraktionsniveau beschrieben werden um das System berblicksartig vorzustellen Dies geschieht deshalb noch vor der Erl uterung der Architekturvisionen weil sich diese nicht auf das grobe Architekturschema oder das Zusammenspiel der einzelnen Komponente beziehen sondern auf Gegenst nde eines h heren Detaillierungsgra des Abbildung 14 zeigt das Komponentenmodell als eine der gr tm glich sinnvollen Architekturabstraktion C Metadatengenerator C AdminTools C AccessTools a ee ersistence O p Fe file database Abbildung 14 Komponentenmodell der HSSS Gesamtanwendung Das Gesamtsystem des HSSS besteht demnach im Wesentlichen aus den drei Kom ponenten MetadatenGenerator AdminTools und AccessTools Bei dem Meta datenGenerator handelt es sich um die bereits in der Belegarbeit zu gro en Teilen realisierte Anwendung die es Autoren der TU Dresden auf eine bequeme Art und Weise erlaubt die Metadaten zu ihrer Hochschulschrift zu erstellen und an die SLUB zu bermitteln Die Systemkomponente AdminTools erlaubt den Mitarbeitern des Referats 5 3 den gesamten Arbeitsablauf softwaregest tzt zu begleiten und zu ko ordinieren Vor allem die Aktionen die die Bearbeitung
275. ndizes umgewandelt Die API erm glicht dabei die Indizes auf verschiedene Weise persistent oder transient anzulegen Normalerweise wird f r jeden Index ein eigenes Verzeichnis verwendet dass verschiedene Dateien enth lt die jeweils ein Segment des Indexes repr sentieren Ein Dokumentenindex besteht bei Lucene vereinfacht gesehen aus einer Menge von Termen die wiederum durch ein Tupel aus Feld und Token definiert sind L LUc Die Hauptaufgaben bestehen dabei darin die Dokumentenindizes zu erstellen und diese gegebenenfalls zu mischen Das Besondere an Lucene s Index Strategie ist dabei dass das inkrementelle Indizieren von Dokumenten genauso performant unterst tzt wird wie das vollst ndige Indizieren aller Dokumente Dabei benutzt Lucene einen speziellen einen Stapel von Segmenten verwaltetenden Algorithmus um einzelne Indexsegmente flexibel in gr ere Segmente zu mischen L LUd 1 erstelle einen Index f r jedes neu dazukommende Dokument 2 lege den neuen Index auf den Stapel 3 f hre den eigentlichen Mischungs Algorithmus aus Es sei M der Mischungsfaktor und K unendlich sowie size eine lokale Variable for size 1 size lt K size size M if es sind M Indizes mit size Dokumenten oben auf dem Stapel nimm diese Indizes vom Stapel mische sie in einen einzigen Index lege diesen Index zur ck auf den Stapel else abbrechen 16sinnvoll zum Beispiel bei URL s etc 17Teil des Inhalts oder der gesamte
276. ndung wird potentiell im Vergleich zu den an deren beiden von noch wesentlich mehr Nutzern besucht werden so dass berlegungen zu einem nutzerfreundlichen Layout dieser Anwendung sehr wichtig sind Wie die Ent wicklung des MetadatenGenerator im Rahmen der Belegarbeit gezeigt hat bestehen die gr ten Design Probleme bei Web Anwendungen in der notwendigen Unterst t zung unterschiedlicher Browser Browserversionen und den unterschiedlichen lokalen Systemgegebenheiten der Nutzer ber die streng genommen keine Annahmen getrof fen werden d rfen Insbesondere die Bildschirmaufl sung ist eine zur Zeit sehr stark variierende Gr d die einen nicht zu untersch tzenden Einfluss auf die Nutzbarkeit einer Web Seite hat und deshalb beim Design unbedingt zu beachten ist Eine L sungsm glichkeit besteht in der Wahl eines festen absoluten Designs etwa f r 800 600 Bildpunktd Damit sind zwar die meisten Nutzer in der Lage das Angebot einigerma Ben benutzerfreundlich ohne horizontales scrollen in ihren Browsern zu betrachten allerdings verschwendet das Design unter Umst nden 75 des vorhandenen Platzes bei Nutzern mit einer 1600 1200 Aufl sung Die Wahl eines flexiblen Layouts mit prozen tualen Werten dagegen erlaubt nur eine bedingte nicht determinierte Kontrolle des Layouts und ist ebenfalls nicht ideal Die Verwendung einer Mischung von absoluten und prozentualen Angaben insbesondere der zus tzliche Finsatz von DHTMIP ist 22S
277. ne Schlagworte in deutsch oder englisch Schlagworte nach der Schlagwortnormdatei SWD sowie Klassifikationen nach DNB bzw RVK Eine eindeutige Zuordnung ist also durch die Attribute subject_id metadataset_id und type gegeben weshalb auch alle drei Attribute gemeinsam einen Schl sselkandidaten bilden Weitere Meta datenelemente die ber eine solche Beziehung mit der Relation pers_metadataset 25Da ein solcher nicht zusammengesetzter Prim rschl ssel verwendet wird ist es wichtig durch un ique description_id metadatset_id dieses Tupel zu einem Schl sselkandidaten Alternate Key zu machen 169 5 Teilanwendung 2 AdminTools verbunden sind sind u a Daten mit den Typen Pr fungsdatum Abgabedatum Ver ffentlichungsdatum und Titel mit den Typen Originaltitel Untertitel bersetzte Titel Weitere Informationen finden sich im Anhang im Kapitel C ab Seite Die folgende Tabelle 10 zeigt noch einmal die Zuordnung der Dublin Core Kategorien zu den gerade vorgestellten Strukturen des Datenbankschemas Struktur DUBLIN CORE KATEGORIE Struktur 1 DC Identifier 1 1 Beziehung DC Language DC Type DC Publisher DC Contributor DC Rights Struktur 2 DC Description direkte N M Beziehung DC Sorce Struktur 3 DC Date indirekte N M Beziehung DC Format DC Person DC Relation DC Subjec DC Title Tabelle 10 Zuordnung der DC Kategorien zu den Strukturen Eine zweiter Schwerpunkt der Persistenzrealisierung neben de
278. ng der Prim r Metadaten an den entspre chenden Fachreferenten Hier wurde auf Wunsch der SLUB eine L sung vorgesehen die das Ausdrucken der bereits im System befindlichen Prim r Metadaten und das anschlie ende Verschicken ber die Haus Post beinhaltet Die bermittlung der se kund ren Metadaten vom Fachreferenten zur ck zum Referat 5 3 folgt dem selben Prinzip Das ist nat rlich sehr ineffektiv wenn man bedenkt dass an zwei Stellen bereits digitalisierte Daten in einem manuellen Vorgang wieder vom Papier zur ck in das System gebracht werden Ein erster Kompromiss der an dieser Stelle vorgese hen wurde ist das Versenden der prim ren bzw sekund ren Metadaten als E Mail was von der Administrationsanwendung Admin Tools gew hrleistet werden m sste In diesem Fall k nnte der entsprechende Mitarbeiter des Referats 5 3 die Sekund r Metadaten wenigstens ber kopieren und einf gen in das Systen einbringen Noch bessei w re die Realisierung einer direkten Interaktionsm glichkeit f r die Fachreferenten in Bezug auf die Administrationsanwendung Dies w rde bedeuten dass auch sie Zugang zu dieser Schnittstelle h tten und somit die entsprechenden Ak tionen Erstellung der sekund ren Metadaten direkt durchf hren k nnten Technisch steht einer solchen L sung nichts im Wegd allerdings erfordert sie einen gewissen or ganisatorischen Aufwand der sich unter anderem auch durch notwendige Schulungen bzw Weiterbil
279. nistrativen Werkzeuger in die Anwendung Die folgenden Anforderungen an einen Hochschulschriftenserver sind ebenfalls gerechtfertigt und von hoher Priorit t k nnen aber aufgrund ihres gro en Realisierungsaufwands im Rahmen des Diploms nicht angegangen werden Zu diesen Anforderungen geh ren e Die Anforderung nach der Einbindung in eine PKI Dazu ist es notwendig dass der Web Server und die Anwendung ein sicheres Protokoll z Bsp SSL unter st tzen bei HSSS realisiert aber auch der Aufbau einer eigenen CA die in der Lage ist sowohl Nutzer Rechner Dokumentenserver und auch Dokumente zu zertifizieren Das ist mit hohem technischen und zeitlichen Aufwand verbunden und muss einer kommenden Ausbaustufe des HSSS vorbehalten bleiben e Die Nutzung der bereits vorgestellten Auszeichnungssprache DiML und der da mit zusammenh ngenden Werkzeuge br chte einige wesentliche Vorteile mit sich kann aber insbesondere aufgrund des hohen organisatorischen Aufwands noch nicht im Rahmen des Diploms realisiert werden Es ist aber unbedingt anzuraten diese Technologien in einer weiteren Ausbaustufe des HSSS in Zusammenarbeit mit den Fakult ten der TU Dresden einzuf hren 26 Zum Beispiel eine integrierte Benutzerverwaltung und Bearbeitung der Konfigurationsdateien in nerhalb der Administrations Anwendung etc 60 3 Systemarchitektur Inhalt des Kapitels be alk ea eee ee 3 1 1 Gesch ftsmodell f r Dissertationen
280. nktionalit t und eine gro e Zahl von Webanwen dungen die auf dieser Technologie basieren NACHTEILE PHP eignet sich zur Zeit noch nicht uneingeschr nkt f r die Entwicklung gro er und verteilter Webanwendungen Architekturkonzepte wie sie bei spielsweise Java seit Jahren unterst tzt halten im PHP Bereich erst in letzter Zeit Einzug und erreichen bei weitem nicht die erforderliche Integri t t Die wichtigsten Vorteile der gew hlten Technologie die auf Java basiert und aus eine Kombination von Servlets und Java ServerPages besteht werden im Folgenden noch einmal zusammengefasst e Die gew hlte Technologie zeichnet sich durch konsequente Objektorientierung intuitive Aufrufsemantiken und offene Spezifikationen aus e Sie ist aufgrund ihrer Architektur weitestgehend plattformunabh ngig e Im Vergleich zu den meisten Alternativen zeichnet sich die gew hlte L sung durch eine h here Stabilit t im Laufzeitverhalten und eine gute Performance auch in Lastsituationen aus e Die Technologie basiert auf einer Programmiersprache die zu den modernsten Sprachen z hlt und sich nach wie vor berdurchschnittlich erfolgreich entwickelt Somit stehen eine Vielzahl von Schnittstellen und Bibliotheken in der Regel zur freien Verf gung e Die Unterst tzung dieser Technologie durch die Webserver nimmt st ndig zu Durch starke Pr senz dieser Technologie im Enterprise Application Bereich J2EE f hrt in Zukunft kein Weg an ihr vorbe
281. nn alle Arbeitsablauf Schritte von ei nem beliebigen Punkt der Erde realisierbar einen Browser und eine HTTP respektive SSL Verbindung vorausgesetzt e Die bersichtsseiten auf denen alle tempor ren bzw alle eingestellten Metada tens tze pr sentiert werden sollten so erweitert werden dass sie auch im Falle gro er Metadatensatzzahlen eine bersichtliche Darstellung erm glichen Dazu ist es h chstwahrscheinlich notwendig nur einen Teil der Metadatens tze an zuzeigen Eine weitere M glichkeit w re die Ordnung bzw Reihenfolge der Metadatens tze dynamisch nach einer der vier angezeigten Informationen Titel Bearbeitungsnummer Status und letztes Bearbeitungsdatum neu zu erstellen e Die XML basierten Strukturen die zur Zeit im Rahmen der Administrationsinte gration noch direkt ge ndert werden m ssen sollten durch eine zwischengeschal tete Anwendung vor den Benutzern verborgen werden Diese Anwendung sollte 225 8 Zusammenfassung und Ausblick die Konfigurationsstrukturen zum einen in einer benutzerfreundlichen Art und Weise aufbereiten durch grafische Formulare etc zum anderen sollte sie die Konfigurationsstrukturen vor direkten Manipulationen sch tzen indem sie n derungen zun chst auf deren Korrektheit berpr ft So kann verhindert werden dass die Gesamtanwendung infolge korrupter Konfigurationsstrukturen nicht ver f gbar ist 8 2 4 Verbesserungsm glichkeiten f r die AccessTool myHSSS Die
282. nsatz Abgabe Formate 240 A 2 Spezifikation der Metadaten Bezeichnung ORIGINAL FORMATE Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion originale s Format e des an den HSSS bermittelten Dokumen tes DC Format Original de_format original secondary optional 0 n 3 100 Tabelle A34 HSSS Metadatensatz Original Formate A 2 11 DC SOURCE Bezeichnung VER FFENTLICHUNGS TITEL Beschreibung Titel einer Ver ffentlichung der Hochschulschrift DC Bezeichnung DC Source Title Parametername dc_source_ title Metadatentyp primary Regulation optional H ufigkeit 0 1 L ngenrestriktion 10 255 Tabelle A35 HSSS Metadatensatz Ver ffentlichungs Titel Bezeichnung VER FFENTLICHUNGS ISBN Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion ISBN falls vorhanden einer Ver ffentlichung der Hochschul schrift DC Source ISBN de_source_isbn primary optional 0 1 10 255 Tabelle A36 HSSS Metadatensatz Ver ffentlichungs ISBN 241 A Metadatens tze des HSSS A 2 12 DC LANGUAGE Bezeichnung SPRACHE DES DOKUMENTS Beschreibung Die Sprache n in der denen die Hochschulschrift verfasst ist DC Bezeichnung DC Language Parametername dc language Metadatentyp primary Regulation mandatory H ufigkeit 1 1 L ngenrestriktion 2
283. nsdatei web xml handelt es sich um die von der Servlet Spezi fikation definierte Konfigurationsdatei f r eine Web Anwendung Sie dient dazu den Servlets einer solchen Anwendung bestimmte Informationen zukommen las sen zu k nnen und wird von jedem Servlet Container unterst tzt indem die Datei bei der Initialisierung der Web Anwendung eingelesen und die enthaltene Information in bestimmten den Servlets verf gbaren Objekten abgespeichert wird Die forma le Struktur dieser Konfigurationsdatei wurde bereits im Abschnitt auf Sei te erl utert weshalb an dieser Stelle auf den konkreten Inhalt der web xml Konfigurationsdatei des HSSS eingegangen werden soll der Informationen f r jedes Servlet der Gesamtanwendung enth lt Folgende Servlets existieren innerhalb der HSSS Gesamtanwendung e hsss metadatagenerator MetadataGeneratorServlet Dieses Servlet fungiert als Controller der Teilanwendung MetadatenGenerator e hsss admintools AdminToolsServlet Dieses Servlet fungiert als Controller der Teilanwendung Admin Tools e hsss accesstools AccessToolsServlet Dieses Servlet fungiert als Controller der Teilanwendung Access Tools e hsss urlmapping UrlMappingServlet Dieses Servlet realisiert die Abbildung von stabilen virtuellen URL s auf reale URL s e hsss oai OAIServlet Dieses Servlet implementiert das OAI Protokoll so dass der HSSS in einem Archivverbund als Data Provider fungieren kann F r diese unterschiedlichen Servlets
284. ntegration eines zweiten Bestandteils in die Bearbeitungsnummer verringert werden Dabei handelt es sich um eine sichere 4 stellige Zufallszahl LFBOO die mit einem 33der Zeitpunkt der Initialisierung der Bearbeitungsnummer durch das System 34Dabei wird nicht der normale Zufallszahlengenerator aus dem Package java util verwendet weil dieser keine kryptographisch zuf lligen Werte erzeugen kann sondern ein entsprechender Genera 92 3 3 Architekturdetails Trennzeichen an den Zeitstempel angef gt wird Zusammengesetzt hat eine Bearbei tungsnummer also die Form lt timestamp gt lt random gt z Bsp 994313565203 3414 Die Wahrscheinlichkeit einer Kollision ist damit u erst gering und w rde berdies im weiteren Verlauf durch die Anwendung erkannt werden Der gro e Vorteil dieses Ansatzes ist der dass die Anwendung zur Erstellung der Bearbeitungsnummer keine weiteren externen Informationen ben tigt und daher sehr unabh ngig ist Alternativ w re nat rlich auch ein inkrementeller Ansatz denkbar der zun chst auch trivialer anmutet Allerdings bliebe in diesem Fall die Verantwortung eindeutige Bearbeitungsnummern durch das Inkrementieren eines bestimmten Wertes zu erzielen direkt bei der Anwendung Diese ist dazu auf die persistente Information der letzten vergebenen Bearbeitungsnummer angewiesen was ein Nachteil bei der Erstellung ist sowohl was die Performance als auch die Unabh ngigkeit betrifft tor aus
285. ntentyp zur ck so dass diese ihn f r weitere Datenbankinteraktionen innerhalb des Einstellvorgangs verwenden kann Zu n chst berpr ft die gespeicherte Prozedur in Zeile s ob der von der Anwendung bermittelte Dokumententyp schon exisitiert In diesem Fall w re die Prozedur be reits beendet und w rde die entsprechende Identifikationsnummer zur ckgeben An dernfalls ist der Dokumententyp in der Datenbank neu zu erstellen Da die Relation pers_type aber durch einen Fremdschl ssel mit der Relation pers_kindofdokument verbunden ist siehe C im Anhang ben tigt die gespeicherte Prozedur die entsprech ende Identifikationsnummer und muss zun chst berpr fen ob die von der Anwen dung bermittelte Dokumentenart bereits in der Datenbank existiert Wenn das der Fall ist erstellt die gespeicherte Prozedur ab Zeile 24 ein neues Tupel in der Tabelle pers_type wobei sie f r den Fremdschl ssel kindofdocument_id den gerade erhalte nen Wert der Anfrage aus Zeile s verwendet und gibt die Identifikationsnummer dieses Tupels zur ck Sollte auch die Dokumentenart noch nicht in der Datenbank existent sein muss die gespeicherte Prozedur ab Zeile 10 erst den entsprechenden Eintrag in pers_kindofdocument erstellen die Identifikationsnummer der Dokumentenart ermit teln und anschlie end die Eintragung in pers_type vornehmen Anschlie end wird wieder die Identifikationsnummer des aktuellen Dokumententyps an die Anwendung zur ckgegeben Nach dies
286. nterst tzung verfolgt werden 36Damit ist die Bildung beliebiger erreichbarer Teilmengen gemeint so dass z Bsp die durch die Wahl von Ver ffentlichungsjahr 2000 entstehende Teilmenge durch Fakult t Informatik aber auch durch Dokumententyp Forschungsbericht wahlfrei verkleinerbar ist genau so gut aber auch die Reihenfolge Dokumententyp Forschungsbericht und anschlie end Ver ffentlichungsjahr 2000 gew hlt werden d rfte und zum selben Ergebnis f hrt 206 6 4 Einsch tzung Nutzer jot Ein solches Portal sollte zus tzlich externe Inhalte integriererf z Bsp solche anderer bibliothekarischer Institutionen etc Au erdem ist ei ne datenbankgest tzte Realisierung von persistenten Logins notwendig um ein dauerhaft personalisiertes Angebot etablieren zu k nnen Daraus ergeben sich weitere vielf ltige Dienste wie etwa eine pers nliche abspeicherbare Sicht der Benutzeroberfl che Farben Anordnungen etc oder persistent abspeicherba re Treffersammlungen Au erdem w re die Speicherung von Interessensprofilen denkbar welche die automatische Benachrichtigung der Nutzer im Falle pas sender neu eintreffender Hochschulschriften erm glichen w rde und vieles mehr Die technischen Voraussetzungen f r die Realisierung solcher Angebote existieren bereits jetzt 37Das bedeutet dass die bisherigen HSSS Seiten hier integriert werden sollten 38 wie mit der Integration der Fireball Wissen Suche berei
287. ntyp Regulation H ufigkeit L ngenrestriktion Art der Dokument bermittlung z Bsp per Mail als CD oder durch Angabe einer URL keine temp _ transmission primary mandatory 1 1 2 100 Tabelle A41 HSSS Metadatensatz Dokument bermittlung Bezeichnung EINGANGSDATUM Beschreibung Datum wann der Metadatensatz bei der SLUB eingegangen ist DC Bezeichnung keine Parametername temp_ incoming Metadatentyp system Regulation mandatory H ufigkeit 1 1 Langenrestriktion 10 50 Tabelle A42 HSSS Metadatensatz Eingangsdatum Bezeichnung ABGABEDATUM DES DOKUMENTS Beschreibung Datum wann das Dokument vom Autor abgegeben worden ist DC Bezeichnung keine Parametername temp delivery Metadatentyp primary Regulation optional H ufigkeit 0 1 L ngenrestriktion 10 50 Tabelle A43 HSSS Metadatensatz Abgabedatum des Dokuments 244 A 3 Spezifikation der tempor ren Metadaten Bezeichnung LETZTE BEARBEITUNG Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Datum wann der Metadatensatz zuletzt von einem Mitarbeiter der SLUB bearbeitet worden ist keine temp__lastprocessed system mandatory 1 1 10 50 Tabelle A44 HSSS Metadatensatz Datum der letzten Bearbeitung Bezeichnung BEARBEITUNGSNUMMER METADATENSATZ ID Beschreibung Eindeutige Bearbeitungsnummer des Metadatensatzes DC Bezeichnung
288. oc Document null MetadataSetDataRetriever doc Doq getMetadataSets config ServietCon getDate el Element hsss utilities Da subElements Map Abbildung 24 HSSS Package rml Ausschnitt Die Klasse HsssDataRetriever erstellt dabei die Objekt Repr sentation der Kon figurationsstruktur hsssdata xml unterst tzte Sprachen Formate Dokumentenar ten etc und die Klasse MetadataSetDataRetriever die Objekt Repr sentation einer Metadatensatzbeschreibung MetadataSetDissertation xml oder MetadataSet Bericht ml Die Klasse MetadatSetTransformer kann XML basierte Metadaten satzstrukturen mit Hilfe von XSL Dateien und einem XSLT Prozessoi in verschiede ne Zielformate u a andere XML Strukturen XHTML PDF usw umwandeln Die Klasse PDFTransformer ist auf die Umwandlung von XML in PDF spezialisiert und eignet sich insbesondere auch zum asynchronen Aufruf um zum Beispiel die PDF Datei innerhalb eines separaten Threads parallel zu erstellen Alle weiteren Packages innerhalb von utilities werden separat im Zusammenspiel mit den Teilanwendun gen erl utert 46Die Anwendung verwendet den XSLT Prozessor Xalan der ASF siehe Anhang auf Seite 279 104 3 3 Architekturdetails 3 3 2 3 Architektur und Entwurfsmuster Muster spielen in der modernen Softwareentwicklung eine immer gr ere Rolle Mit Hilfe von Mustern lassen sich Erfahrungen im Zusammenhang mit der Analyse dem Design und der Implementa
289. ologische Alternativen erfolgen 3 3 3 1 Einordnung in die Gesamtarchitektur Die Architekturdetails auf der Client Ebene sind abh ngig von der gew hlten Archi tektur des Gesamtmodells F r Webanwendungen gibt es insbesondere zwei benannte Architekturans tze siehe AAB00 PLC99 die man verfolgen k nnte Der erste Architekturansatz der als page centric approach AABOO bzw Web Application Model 1 bekannt ist ist in Abbildung 28 zu sehen EE Ka A EE EE ET a T E Ee Schicht 2 objekte Antwort DBMS Gesch fts Abbildung 28 Architektur page centric approach 2 Tier Dieses Modell verfolgt einen Zwei Schichten Ansatz bei dem die Java ServerPages in Schicht 1 sowohl die Benutzerinteraktionen als auch gro e Teile der Gesch ftsfunk tionalit t so auch direkte Zugriffe auf Daten bernehmen Es eignet sich eher f r kleinere Webanwendungen und hat den spezifischen Nachteil dass in Schicht 1 Lay out Repr sentation Anwendungslogik und Datenstrukturen relativ stark vermischt werden Abildung 29 zeigt auf der folgenden Seite einen alternativen Ansatz der das Model View Controller Paradigma auf der Ebene von Webanwendungen relativ gut realisiert Er wird in auch als dispatcher approach bezeichnet weil 108 3 3 Architekturdetails das Servlet in Schicht 2 als Controller oder Dispatcher zwischen den verschiedenen JSP s der Schicht 1 View und den Gesch ftsobjekten bzw den Date
290. ommen allerdings nicht validiert werden Das hat den Vorteil dass die Daten vom Nutzer in diesem Fall nicht umsonst eingegeben werden verur sacht aber einige Schwierigkeiten in der Behandlung auf der Serverseite Eine weitere Verbesserung der Navigation w re die Einf hrung einer kontext sensitiven SiteMap die die augenblickliche Position in der Abfolge der Masken grafisch visualisiert und gleichzeitig selbst zur Navigation genutzt werden kann Dies d rfte allerdings nur in Abh ngigkeit der aktuellen Situation geschehen und stellt insbesondere an den serverseitigen Teil des Metadaten Generators hohe Anforderungen Das Layout der Teilanwendung k nnte weiter verbessert werden indem die posi tiven Erfahrungen mit der serverseitigen Skalierung der Benutzeroberfl che die 1So sollte der Nutzer nicht von Seite 1 auf die bersicht springen d rfen sondern m sste zun chst alle Masken in der vorgegebenen Reihenfolge durchlaufen hat er diese aber quasi freigeschaltet darf er sich frei bewegen und gegebenenfalls auch Masken berspringen Dies k me insbeson dere dem Anwendungsfall zugute bei dem ein Nutzer ausgehend von der bersichtsmaske eine Korrektur auf Seite 1 vornimmt und anschlie end mit Hilfe der grafischen SiteMap direkt zur bersichtsseite zur ckspringen kann Bisher muss er alle dazwischenliegenden Masken sequen tiell durchlaufen 224 8 2 Verbesserungsm glichkeiten bei der Entwicklung der Teil
291. on Bezeichnung RVK KLASSIFIKATION Beschreibung Klassifikation der RVK DC Bezeichnung DC Subject Parametername dc_subject_rvk Metadatentyp secondary Regulation mandatory H ufigkeit 1 10 L ngenrestriktion 3 100 Tabelle A14 HSSS Metadatensatz RVK Klassifikation 234 A 2 Spezifikation der Metadaten Bezeichnung SWD SCHLAGWORTE Beschreibung Schlagworte nach der Schlagwortnormdatei SWD DC Bezeichnung DC Subject Parametername dc_subject_rvk Metadatentyp secondary Regulation mandatory H ufigkeit 1 10 L ngenrestriktion 3 100 Tabelle A15 HSSS Metadatensatz SWD Schlagworte A 2 4 DC DESCRIPTION Bezeichnung BESCHREIBUNG ABSTRACT DEUTSCH Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Textuelle Inhaltsbeschreibung oder Abstract des Dokumentes in deutsch DC Description de description ger primary mandatory SS 100 2000 Tabelle A16 HSSS Metadatensatz Beschreibung deutsch Bezeichnung BESCHREIBUNG ABSTRACT ENGLISCH Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Textuelle Inhaltsbeschreibung oder Abstract des Dokumentes in englisch DC Description de description eng primary mandatory 1 1 100 2000 Tabelle A17 HSSS Metadatensatz Beschreibung englisch 235 A Metadatens tze des HSSS
292. on der Struktur des Objektes abh ngig Wenn sich diese zu stark ndert k nnen fr here Serialisierun gen unter Umst nden nicht wieder korrekt deserialisiert werden was im schlimmsten Fall einen Datenverlust bedeuten k nnte Au erdem ist eine Serialisierung von der ver wendeten Programmiersprache in diesem Fall Java und sogar deren Version abh ngig und somit nicht universell lesbar oder austauschbar Die Vorteile von XML an dieser Stelle bestehen also insbesondere darin dass sich ein solcherart repr sentierter Meta datensatz universell austauschen und im Notfall auch extern bearbeiten lie e und sogar bei einem kompletten Wechsel des Metadatenformats relativ leicht angepasst werden k nnte Um diese Vorteile zu realisieren m ssten die Metadatens tze des HSSS al so bei der tempor ren Speicherung von einer Objektstruktur in eine XML Struktur abgebildet werden bzw umgekehrt wie Abbildung 16 verdeutlicht Abbildung 16 Abbildung Objektstruktur XML Struktur Der MetadatenGenerator w rde in diesem Szenario also am Ende der Interaktionen mit dem Autor die Repr sentation des Metadatensatzes von einer Objektstruktur im Hauptspeicher in eine tempor r persistente XML Struktur umwandeln die sich in einer Datei oder in einer Datenbank befindet Aus dieser Datenquelle w rden die Ad min Tools die XML Struktur mit Hilfe eines geeigneten Parsers wieder einlesen und in 160Objektserialisierung bedeutet dass ein im Hauptspeicher be
293. on in einer bestimmten Datenstruktur gespeichert werden und zu einem beliebigen Zeit punkt verf gbar sind Die Treffer werden gesammelt indem der Nutzer auf das Notizzettel Symbol klickt welches f r jeden Treffer generiert wird siehe z Bsp Abbildung 58 Dadurch wird der zugeh rige Treffer automatisch gespeichert und die Anzeige Meine Treffer aktualisiert siehe Abbildung 57 in der linken Spalte Die gesammelten Treffer k nnen jederzeit angezeigt werden indem auf den Button Meine Treffer oder auf das Notizzettel Symbol in der linken Spalte von myHSSS geklickt wird Es erscheint eine Ansicht die der in Abbildung 60 gezeigten hnelt SLUB AccessTools Microsoft Internet Explorer _ x Datei Bearbeiten Ansicht Favoriten Extras 2 A A 3 D 3 M Zur ck Varner Abbrechen Aktualisieren Startseite Suchen Favoriten Verlaut E Mail Drucken Beztbeiten Ad esse http b00102 slub dresden de hsss servlet hsss accesstools AccessT oolsServlet v Wechseln zu Links gt D myHSSS SL FIREBALL HochschulSchriftenServer der SLUB Dresden y UB A Fragen oder je ss SL Technische Probleme MEA AS UB Universitat Schicken Sie eine Dresden Email em TC News Volltext Feldsuche Navigation tt me J Meine Treffer 5 WEE RER Sie haben 3 Treffer gesammelt Sie k nnen in den einzelnen 1600 1200 Suchfeldern nach mehreren Begriffen al al suche
294. onaten oder Jahren ergeben obwohl sie aufgrund ihrer sehr guten Konfigurierbarkeit daf r besser ger stet ist als die meisten anderen An wendungen Wenn die SLUB auch mittelfristig aus den entstandenen Entwicklungen Nutzen ziehen will ist es absolut notwendig dass die bestehende Anwendung konti nuierlich gewartet und weiterentwickelt wird Um eine solche Kontinuit t zu gew hr leisten ist es nach Ansicht des Autors notwendig f r diese Aufgabe eine feste Stelle zu schaffen die sich aufgrund des inhaltlichen Bezuges in organisatorischer N he des Referats 5 3 befinden sollte Alles andere kommt einem langsamen aber relativ siche ren Todesurteil f r den HSSS gleich Dann aber muss sich die SLUB fragen lassen wie sie einen solche Dienst alternativ realisieren will Noch einmal alle Voraussetzungen daf r dass die SLUB mit einem modernen Hochschulschriftenserver den ersten Schritt auf dem Weg zu einer zukunftsf higen Hybridbibliothek Wis01 mit einem Portfolio an digitalen Dienstleistungen unternehmen kann sind durch die Diplomarbeit erf llt Ob diese Chance erfolgreich genutzt werden kann h ngt davon ab wie konsequent die begonnene Entwicklung weitergef hrt wird Die Entscheidung dar ber liegt selbstver st ndlich bei der SLUB Das k nnen die wenigsten Produktivversionen Es war auch nicht die Aufgabe der Diplomarbeit eine solche Version zu entwickeln Dies gilt f r jede Art von Software 227 A Metadatens tze des
295. ondern vielmehr ein Problem des fehlenden Bewusstseins kaum jemand denkt in Bezug auf digitale Archivierung in den richtigen sehr gro en Zeitdimensionen So bleibt f r die Praxis nur eine Strategie die auch die alten gypter vor Jahrtausenden schon anwandten das Kopieren Aber selbst wenn diese Probleme praktisch gel st und langlebige Datentr ger f r die digitale Archivierung verf gbar w ren bliebe ein weitaus schwierigeres bestehen das der unterschiedlichen Formate Schon heute sind eine Vielzahl von Datenformaten nach geschichtlich gesehen erschreckend kurzer Zeit ca 5 40 Jahren bereits nicht mehr lesbar die darin kodierten Informationen also verloren Auch f r die Zukunft ist abzusehen dass nur einige wenige der heute gebr uchli chen Datenformate mittelfristig lesbar bzw verarbeitbar bleiben werden Kurzfristig hilft hier nur f r die Archivierung m glichst weitverbreitete einfache Formate zu verwenden und auf Komprimierung etc zu verzichten Langfristig kann nur ein f r Konverter publiziertes Formatschema bzw ein einheitliches Datenformat bzw Datei format f r die digitale Archivierung Abhilfe schaffen Gro00 Auf diesem interessanten Gebiet sollten vor allem auch die Bibliotheken aktiv werden und bleiben da hier L sungen f r die Zukunft gerade auch f r sie dringend erforderlich sind 7So sind etwa f r die Anfang der 90 er Jahre als Archivierungsmedium auch in Bibliotheken noch gebr uchlichen 5 1 4 Zoll
296. oniertes Schema vorausgesetzt in der Regel nicht erreichen Da das voraussichtliche Schema des HSSS keinen berdimen sionalen Komplexit tsgrad erwarten l sst und der Fokus eindeutig auf Stabilit t und Geschwindigkeit liegt spielen objektorientierte Datenbankverwaltungssysteme im wei teren Verlauf der Evaluation keine Rolle 527 Bsp durch die M glichkeit direkt auf Teilstrukturen zugreifen zu k nnen durch ein automati sches Umsetzen von XML Strukturen in das jeweilige interne Datenmodell etc 53wobei zu dieser Kategorie auch die Postrelationalen bzw Objektrelationalen Datenbankverwal tungssysteme ORDBMS gez hlt werden sollen 54in diesem Sinne nat rlich keine technische Einteilung diese Datenbanken k nnen also jeweils einer der Kategorien ODBMS XML DBMS oder RDBMS angeh ren 115 3 Systemarchitektur Ein XML basiertes Datenbanksystem h tte f r den HSSS den gro en Vorteil dass die vielfach vorhandenen XML Strukturen sehr elegant n mlich direkt durch die Da tenbank behandelt werden k nnten Sie br uchten nicht durch die Anwendung geparst zu werden sondern k nnten direkt in der Datenbank ge ndert werden Allerdings gibt es nicht sehr viele echte XML Datenbanken mit wirklichem XML Datenmodell und die existierenden sind technisch bei weitem nicht so ausgereift wie etwa objekt orientierte oder gar relationale Datenbanksysteme Eine direkte Behandlung der XML Strukturen durch die Datenbanken w re zwar sch
297. or varchar 100 vi letzter Bearbeiter metadataset text der XML basierte Metadatensatz metadatasetcopy text das XML basierte Metadaten satz Original des Autors Tabelle 5 die Tabelle temp_metadatasets Wie der Tabelle zu entnehmen ist wird die XML Repr sentation des Metadaten satzes zu diesem Zeitpunkt direkt in die Spalte einer Tabelle geschrieben es findet 13wobei die datenbankbasierte Version nat rlich zu bevorzugen ist 14Fine solche XML Datei existiert pro Dokumentenart 134 4 3 Persistenzrealisierung keine Partitionierung bzw Normalisierung auf mehrere Tabellen entsprechend der inneren Struktur des Metadatensatzes statt Das w rde zu diesem Zeitpunkt auch kei nen Sinn machen da der Metadatensatz von der zweiten Teilanwendung Admin Tools gegebenenfalls noch etliche Male iterativ ge ndert wird was im Falle einer Norma lisierung jedesmal den Aufwand bedeuten w rde die Gesamtstruktur durch multiple Joins aus der Datenbank holen zu m ssen und anschlie end wieder partitioniert zu speichern Dies ist erst dann vern nftig wenn die Bearbeitung des Metadatensatzes durch die AdminTools Teilanwendung beendet ist und der Metadatensatz endg ltig persistent eingestellt werden kann Stattdessen wird die XML Struktur also direkt in zwei Spalten der Tabelle abgelegt metadataset und metadatasetcopy so dass sie von der Anwendung sp ter direkt mit Hilfe eines XML Parsers ausgelesen und an schlie end
298. pen Archival Information System OAIS L OAal 19Nach Meinung des Autors ist das schlichtweg unverst ndlich Eine Initiative die bereits ber ein halbes Jahr zur Unterst tzung der OAI aufgerufen hat sollte in der Lage sein in einem Empfeh lungspapier immerhin vom Mai 2001 datiert diese Initiative bzw deren Protokoll wenigstens zu erw hnen Letztendlich sollen ja gerade diese Empfehlungen und die Beachtung von Standards als Grundlage und Vorbereitung f r den Einsatz des OAI Protokolls dienen 49 2 Aufgabenstellung Grundlagen Arbeitsabl ufe 2 4 2 3 Einsch tzung und Wertung 4 Leider werden die Empfehlungen der DINI Arbeitsgruppe Elektronisches Publizieren in ihrer vorliegenden noch unvollst ndigen Version nach Meinung des Autors dem Anspruch Empfehlungen fiir den Umgang mit elektronischen Hochschulpublikationen zu geben nur bedingt gerecht Die Arbeitsgruppe muss sich die Frage gefallen lassen welchem Zweck ihr Dokument letztendlich dienen soll Soll es eine wissenschaftlich fundierte Betrachtung aller in den Prozess des elektronischen Publizierens involvierten Technologien liefern oder sollen interessierten Institutionen bzw Personen praktische Hilfestellungen und Empfehlungen an die Hand gegeben werden so dass fiir sie die Barriere zum Aufbau eines OAI konformen Archives m glichst gering gehalten wird Wie man die Frage auch beantwortet beiden Anforderungen kann das Dokument in der vorliegenden Ver
299. plementation eines deutschen Stemming Algorithmus und dessen Integration in Lucene eine wirksame Erweiterung und eine lohnende Aufgabd e Fiir die bisher sehr aufwendige Skalierung der Grafiken durch vorherige Erstel lung von separaten Grafiken f r jede unterst tzte Aufl sung sollten andere L sungen gefunden werden Hier besteht allerdings eine Abh ngigkeit von der Browserentwicklung und insbesondere deren F higkeiten in Bezug auf Vector grafikformatd Gegebenenfalls ist auch die Verf gbarkeit einer alternativen Version von myHSSS ohne Grafiken sinnvoll e Die relativ einfache Realisierung der Navigation sollte deutlich erweitert werden So w re eine grafisch intuitive Pr sentation der Navigation in Form einer Baum struktur o sinnvoll Eine m gliche Realisierung der Navigation w re die sie so unabh ngig wie m glich von den schon getroffenen Einschr nkungen zu machen so dass jederzeit noch alle sinnvollen Navigationsm glichkeiten offen stehen e Die Benutzeroberfl che myHSSS sollte kontinuierlich zu einem Portal ausgebaut werden so dass es der einzige zentrale Interaktionspunkt f r alle im Zusam menhang mit dem HSSS stehenden Informationen und Funktionalit ten f r alle 34Eine solche Implementierung sollte selbstverst ndlich ver ffentlicht und anderen Nutzern insbe sondere den Entwicklern von Lucene zug nglich gemacht werden 35Hier sollte vor allem die Entwicklung XML basierter Formate wie SVG und deren U
300. pportedDocumentTypes lter getSupportedFaculties lterator FileHsssData SybaseDBHsssData config ServletConfig null config ServletConfig null xmlFile String scm SybaseConfigurationManage supportedLanguages LanguageS supportedLanguages LanguageS2 e Cl SEHR u FileHsssData i init config ServletConfig void i sostatarxcepuon init config ServletConfig void getSupportedLanguages Iteratc fee getSupportedLanguages Iterato getSupportedFormats lterator getSupportedFormats lterator getSupportedDocumentT ypes I5 HsssDataException msg String Abbildung 22 HSSS Package persistence Ausschnitt Das Package temporalpersistence welches im folgenden Abschnitt struktu rell n her erl utert wird ist f r die Umwandlung der Metadatensatz Repr sentation von einer Objektstruktur in eine XML basierte Struktur und umgekehrt zust ndig siehe Architekturvision 1 in Abschnitt sowie f r verschiedene weitere Aktio nen im Zusammenhang mit den Metadatens tzen L schen R cksetzen Einstellen usw Das Package utilities ist das umfangreichste der Gesamtanwendung und besteht neben einer Reihe von weiteren Packages vor allem aus Gesch ftsobjekten Hilfs und Systemklassen wie Abbildung 23 auf der folgenden Seite verdeutlichen soll Am Beispiel des Gesch ftsobjekts Universit t soll der Aufbau vieler hnlich konstruierten Strukturen innerhalb dieses Packages demonstriert werden Das
301. punkte und Besonderheiten der Entwurf m glichst ber cksichtigen soll Diese Archi tekturversion werden daraufhin auf ihre Praxistauglichkeit berpr ft und auf die in der Diplomarbeit realisierbaren Teile begrenzt Anschlie end werden Architekturde tails der Gesamtarchitektur aus verschiedenen Blickwinkeln beleuchtet so etwa der Aufbau von der f r die Anwendungen verwendeten Konfigurationsstrukturen und die Gesamtarchitektur der Client Server und Datenbankebene Nachdem die Grundlagen des Entwurfs auf der Abstraktionsebene der Gesamtar chitektur betrachtet wurde wendet sich die Diplomarbeit den einzelnen Teilanwendun gen zu Zun chst wird die Teilanwendung MetadatenGenerator betrachtet welche den Autoren von Hochschulschriften die Erstellung und bermittlung entsprechender Me 24 1 2 Inhaltstiberblick tadaten erm glichen soll Es werden zuerst spezifische Designentscheidungen erl utert bevor die Realisierung der Teilanwendung beschrieben wird Danach wird die f r diese Teilanwendung verwendete Persistenzrealisierung betrachtet Ein weiterer Abschnitt beschreibt einige zus tzliche Funktionalit ten die w hrend der Diplomarbeit in Zu sammenarbeit mit zwei Auszubildenden der SLUB im Bereich dieser Teilanwendung entstanden sind Schlie lich werden die erzielten Ergebnisse eingesch tzt und m gliche Verbesserungen respektive Erweiterungen vorgestellt Die Teilanwendung AdminTools wird im n chsten Kapitel beschrieben
302. r Die Empfehlungen beginnen mit der Definition einiger Begriffe im Umfeld und versucht im Anschluss eine Motivation welche die neue Arbeitsweise im Umgang mit digitalen Dokumenten mit der traditionellen papiergebundenen Arbeitsweise vergleicht Als wesentliche Vorteile werden der schnelle Zugriff auf die digitalen Dokumente sowie deren weltweite Verbreitung angesehen Au erdem seien genauere Retrievalergebnis se aufgrund der besseren inhaltlichen Erschlie ung dieser Dokumente zu erwarten Die Empfehlungen mahnen au erdem ein anderes Vorgehen bei der Erstellung wis senschaftlicher Dokumente an nicht mehr das Pr sentationsformat Ausdruck son dern die semantische Struktur der Dokumente sollte im Vordergrund stehen da erst dieses Vorgehen eine flexible Mehrfachverwendung der elektronischen Publikation im Internet Druck und Datenbankbereich erm glicht Solange f r die Erstellung aller dings g ngige Software wie etwa MS Word verwendet wird d rfte die angesprochene Umstellung ausbleiben Zu den allgemeinen Anforderungen an das elektronische Publizieren z hlen die Empfehlungen eine Reihe von Prinzipien in den Bereichen Formate Standards Proto kolle Authentizit t Metadaten Retrieval und Langzeitarchivierung Im ersten Teil abschnitt der sich Formaten Standards und Protokollen widmen soll ist lediglich etwas von der Unbrauchbarkeit der meisten gebr uchlichen Textverarbeitungssysteme in Hinblick auf flexible Publikationen zu les
303. r te soll die folgende Abbildung das Zusammenspiel mit externen Komponenten API s und Services in einem Schichtenmodell verdeutlichen HTTP SSL TCP IP HSSS Servlets HSSS Gesamt JDBC bzw JSP s anwendung Driver Erweiterungen Tomcat Servlet Zus tzliche API s HSSS DB Skripte z Bsp mod ssl Container 3 2 1 XML E Mail FTP etc stored Procedures etc Apache Java SDK 1 3 Webserver Core API s etc DEMS Betriebssystem Abbildung 15 Systemkomponenten im Schichtenmodell Auf der Betriebssystemschicht setzen zum einen der Apache Webserver die Java Entwicklungsumgebung inklusive aller Standard API s sowie das Datenbankverwal tungssystem auf Diese drei Systemkomponenten bilden die wesentlichen Bestand teile des HSSS Gesamtsystems und sind als Grundlage aller weiteren Komponen ten unverzichtbar Auf dem Datenbankverwaltungssystem setzt die eigentliche Da tenbank des HSSS auf die im Rahmen des Diploms noch zu realisieren ist Die Java Entwicklungsumgebung mit ihren Standard API s wird durch eine Reihe weite rer API s erweitert werden m ssen um die geforderten Dienste erbringen zu k nnen Der Apache Webserver wird ebenfalls durch einige Erweiterungen erg nzt werden zum 79 3 Systemarchitektur Beispiel durch ein Modul mod ssl welches ihn SSL f hig macht Entscheidender aber ist der Servlet Container Tomcat L TC des Jakarta Projektes L JA der Apache Software
304. r Buchstabe p steht f r parts und dient als Trennmarkierung der folgenden Ziffern die angeben in wieviele Teile das Gesamtergebnis infolge des aktuellen Schwellwertes separiert wurde Alle diese Informationen werden von der Klasse ResumptionCleaner ben tigt die als einzige Klasse des Klassendiagramms noch nicht betrachtet wurde Ihre Notwen digkeit ergibt sich aus der berlegung dass eine Anfrage die eine Teilmenge zu sammen mit einem Wiederaufnahmezeiger zur ckgeliefert hat vom Aufrufenden nicht notwendigerweise wiederaufgenommen werden muss Das f hrt dazu dass die unter Umst nden sehr gro e Restmenge des Ergebnisses umsonst in der daf r vorgesehenen Datenstruktur zum Beispiel im Hauptspeicher verbleibt Vergegenw rtigt man sich zus tzlich dass es sich bei der Protokoll Implementierung um eine serverseitige An wendung handelt die m glicherweise sehr lange unterbrechungsfrei ausgef hrt wird ist es vorstellbar dass das beschriebene Verhalten auf Dauer dazu f hrt dass wesentliche Teile des zur Verf gung stehenden Speichers vergeudet werden und im schlimmsten Fall sogar die Aufrechterhaltung des Dienstes gef hrdet ist Deshalb muss es eine Funktion geben die nach einer bestimmten Zeit die verblie benen nicht abgeholten Restmengen aus der entsprechenden Datenstruktur ent fernt Diese Funktion bernimmt die als eigenst ndiger Thread realisierte Klasse ResumptionCleaner welche gewisse hnlichkeiten z
305. r HTTP POST Requests die im Falle der MetadataGeneratorServlet Klasse an eine einheitliche doIt Methode weitergeleitet werden Von dieser Methode wird die Klasse MetadataGenerator RequestResponseManager genutzt um alle weiteren Aktivit ten im Zusammenhang mit den HTTP Anfragen zu behandeln Dessen Methode handle verrichtet dabei die Hauptarbeit indem die Parameter der HTTP Requests geparst und in entsprechenden Datenstrukturen abgelegt werden und anschlie end die Bearbeitung nach einem be stimmten Schema erfolgt Die Klasse MetadataGeneratorRequestResponseManager benutzt ihrerseits die Klasse MetadataGeneratorSessionManager um die jeweili ge Anfrage auf eine g ltige Session zu testen und diese gegebenenfalls zu erstel len Ist die HTTP Anfrage g ltig bzw deren Session so werden die Parameter der Anfrage ausgewertet und gegebenenfalls die Objekt Repr sentation des Metada tensatzes aktualisiert Parameter k nnen aber auch Auswirkungen auf die Klassen MetadataGeneratorConfiguration und MetadataGeneratorBrowserInformation ha ben Im ersten Fall handelt es sich um eine Klasse die Informationen zur aktuellen Konfiguration der Teilanwendung in Abh ngigkeit von der Session enth lt Im zweiten Fall enth lt die Klasse Informationen zum verwendeten Browser in Abh n gigkeit der Session Dies ist notwendig um die f r die View verantwortlichen Java ServerPages entsprechend zu informieren da in Abh ngigkeit vom jeweils in der Ses
306. r Metadatensatzbeschreibung Eine solche XML Struktur m sste f r jede Dokumentenart des Systems existieren da f r jede Dokumentenart unter Umst nden ein separater Metadatensatz spezifiziert ist Die Anwendung w rde sie zu gegebener Zeit einlesen parsen und die Informatio nen in entsprechenden Objekten ablegen Wie gezeigt k nnen im Prinzip die gesamten Validatorobjekte und Gro teile der grafischen Benutzerschnittstelle automatisch aus diesen Informationen erstellt werden In einer Idealvorstellung lassen sich sogar alle Metadatensatz abh ngigen Teile der ersten beiden Anwendungen komplett automatisiert und zur Laufzeit erstellen In diesem Fall m sste die XML Struktur nat rlich zus tzliche sehr komplexe Informa tionen enthalten die es u a erm glichen alle mit Metadaten in Zusammenhang ste henden Klassen zur Laufzeit zu bilden zu kompilieren auszuf hren und zu speichern Die Anwendung best nde in diesem Fall aus einem relativ kleinen unabh ngigen sta tischen Teil welcher in Abh ngigkeit der zu unterst tzenden Dokumentenarten bzw der entsprechenden Metadatensatzbeschreibungen den weitaus umfangreicheren dy namischen Teil zu Laufzeit erstellen w rde Dies gilt auch f r die automatische Erstel lung von Speicherstrukturen f r die endg ltige Persistenzrealisierung Im Idealfall k nnte man ohne tiefere System oder Programmierkenntnisse mit Hilfe einer weiteren 1Zum Beispiel die automatisierte Generierung von DM
307. r Spezifikation des Datenbankschemas ist die Entscheidung auf welche Art von der Anwendung aus auf die Datenbank zugegriffen werden soll und welche M glichkeiten der Abarbeitung der DDL DML Anfragen dabei genutzt werden soll F r den Zugriff auf vor allem rela tionale Datenbanken aus Java Anwendungen heraus existiert das API JDBC HCE98 L JD welches ein Call Level Interface API ist und starke hnlichkeiten zu ODBC aufweist JDBC erlaubt drei verschiedene Arten Anfragen an eine Datenbank ab zusetzen Die erste M glichkeit besteht darin ein normales Statement an die Da tenbank abzuschicken In diesem Fall wird eine normale SQL Anweisung an die Datenbank geschickt dort ausgef hrt und die Ergebnismenge zur ckgesendet Die Datenbank hat in diesem Fall keine M glichkeit die Anfrage zus tzlich zu optimie ren Die zweite M glichkeit besteht darin ein sogenanntes PreparedStatement zu verwenden Dieses besteht aus einer SQL Anweisung die Platzhalter f r sp ter noch hinzuzuf gende Parameter enth lt Diese Anfrage wird an die Datenbank gesendet und dort f r die Dauer der Anwendung zwischengespeichert und optimiert In einem zweiten Schritt wird der jeweils aktuelle Parameterwert bermittelt und anschlie end die Ergebnismenge zur ckgegeben Dieser Ansatz bietet sich for allem an wenn sich wie etwa select from pers_metadataset where id 1 277 Bsp select from pers_metadataset from id mit z Bsp 1 f r den Platzhal
308. r gespeicherte Prozeduren oder Trigger sehr vorteilhaft Ebenso w nschenswert w re eine XML Unterst tzung insbesondere f r den Zugriff auf XML etwa Integer Varchar n Date etc 114 3 3 Architekturdetails basierte Strukturen innerhalb der Datenbank Zus tzliche Dienste wie z Bsp die Integration einer Volltext Suchmaschine w ren ebenfalls ein hervorragendes Argument f r ein solches Datenbankverwaltungssystem 3 3 4 2 Datenbank Evaluation Die Datenbankevaluation soll an dieser Stelle in erster Linie allgemein d h nicht bezogen auf bestimmte Hersteller oder Produkte durchgef hrt werden Dazu werden die zur Zeit blichen Datenbankverwaltungssysteme grob in die folgenden Kategorien unterteilt Objektorientierte Datenbankverwaltungssysteme ODBMS e XML Datenbankverwaltungssysteme Relationale Datenbankverwaltungssysteme RDBMSP Open Source Datenbankverwaltungssystemd Eine Objektorientierte Datenbank h tte den Vorteil Objektstrukturen direkt per sistent ablegen zu k nnen Das w re besonders dann von Vorteil wenn das zu er wartende Schema u erst komplex ist weil das Datenmodell auch in diesem Fall den schnellen Zugriff auf die Gesamtstruktur erlaubt Allerdings ist eine solche Komple xit t f r das Datenbank Schema des HSSS nicht zu erwarten Ein Nachteil solcher Datenbanksysteme ist dass sie die Zuverl ssgkeit und Performance von relationalen Datenbanksystemen ein nicht extrem partiti
309. r id contributor_id references pers_contributor id rights_id references pers_rights id unique processingid Tabelle A80 die Tabelle pers_metadataset pers_fulltext Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV v y Eindeutige Identifikationsnummer f r die Tabelle fulltext text Volltext der Hochschulschrift metadataset_id numeric 6 Y Metadatensatz Fremdschl ssel metadataset_id references pers_metadataset id unique metadataset id Tabelle A81 die Tabelle pers_fulltext 271 C Datenbank Schema des HSSS pers_date_metadataset Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV v y Eindeutige Identifikationsnummer f r die Tabelle type varchar 100 yY Art des Datums Abgabe Ver ffentli chung etc metadataset_id numeric 6 y Metadatensatz Fremdschl ssel date_id numeric 6 J Datum Fremdschl ssel metadataset_id references pers_metadataset id date_id references pers_date id unique metadataset id date id Tabelle A82 die Tabelle pers_date_metadataset pers_description_metadataset Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV vV y Eindeutige Identifikationsnummer f r die Tabelle metadataset_id numeric 6 Y Metadatensatz Fremdschl ssel description_id numeric 6 y Beschreibung Abstract Fremdschl s sel metadataset_id references pers_metadataset id description dd references pers_description id
310. r obligatorisch ist sowohl dessen Pr sentation in der grafischen Benutzerschnittstelld als auch dessen Behandlung Vali dierung durch die Server seitige Anwendung Neben den in der Abbildung gezeigten lassen sich leicht weitere Bestandteile einer Metadatensatz Spezifikation ausmachen welche die gesamte weitere Anwendung sinnvoll beeinflussen k nnten Tabelle 3 zeigt solche Bestandteile einer Metadatensatz Spezifikation und wie sie das Verhalten und die Struktur der Benutzerschnittstelle Anwendung beeinflussen k nnten SPEZIFIKATIONSBESTANDTEIL BENUTZERSCHNITTSTELLE ANWENDUNG Metadatensatzstruktur allge Einfluss auf Gesamtstruktur Einfluss auf die Objektstruk mein der Benutzerschnittstelle tur Element Attribute wie Be Auswirkung auf das Layout Kein Einfluss schriftung Kurzerkl rung z Bsp Beschriftung der Fel etc der etc Einfluss auf die Art und Weise der Darstellung Element Attribute wie obliga torisch optional maximale An zahl maximale L nge etc Bestimmt wie die Metadaten zu validieren sind Entscheiden ber zeitliche Po sitionierung Behandlung Bearbeitbarkeit innerhalb des Arbeitsablaufs Erlaubt die Selektion von Metadaten Parametern Element Attribute wie primary secondary oder system Entscheiden ob Elemente berhaupt pr sentiert werden Element Attribute die die Kommunikation zwischen Benutzerschnittstelle und Anwendung beschreibe
311. rationalisieren Aus diesem ersten Schritt im Lebenszyklus einer Softwareentwicklung sollen die entschei denden Impulse f r den Entwurf und die prim ren Anforderungen an die Anwendung klar hervorgehen In dieser Phase ist es wichtig durch konstruktive Kommunikation mit dem Kunden so viel seines fachlichen Wissens wie m glich in den weiteren Ent stehungsprozess der Software einflie en zu lassen Am Ende sollte sich ein komplettes Gesch ftsmodell bzw eine Reihe von Arbeitsabl ufen ergeben so dass das Verhalten aller mit der Software im Zusammenhang stehenden Prozesse beschrieben wird Zu Beginn der Belegarbeit und zum Teil auch noch zu Beginn der Diplomarbeit war bei der SLUB kein explizites Gesch ftsmodell zur Behandlung elektronischer Do kumente vorhanden Solche Dokumente wurden quasi nebenbei auf Disketten und CD ROM s angenommen allerdings in keinem geordneten Verfahren Der Fokus lag einzig und allein auf den traditionellen papiergebundenen Publikationen nach denen sich auch s mtliche Arbeitsabl ufe ausrichteten Die zus tzliche Unterst tzung von digitalen Dokumenten verlangt aber zum Teil ganz andere Arbeitsabl ufe zudem sind andere Personen respektive Abteilungen involviert Die besondere Herausforderung war daher die Synchronisation der traditionellen Arbeitsabl ufe mit den sich neu erge benden Eine zus tzliche Schwierigkeit bestand darin dass sich das Gesch ftsmodell ber eine Vielzahl zu beteiligender Personen
312. rationsstruk tur Der Wert null ist erlaubt damit nicht von vornherein 2K belegt werden Tabelle A61 die Tabelle config_metadatasets stat_metadatasets Name DATENTYP I P M BESCHREIBUNG id numeric 5 vV v y eindeutige Identifikationsnummer f r die Tabelle processingid char 100 eindeutige Bearbeitungsnummer des Metadatensatzes kindofdocument varchar 30 y Dokumentenart Dissertation Bericht creationdate datetime Y Eingangsdatum des Metadatensatzes finishingdate datetime Einstellungsdatum des Metadatensat zes swbexportdate datetime 200 Datum des Metadatenexports nach DDB ddbexportdate datetime Datum des Metadatenexports nach SWB swbfeedbackdate datetime Datum der OK R ckmeldung DDB ddbfeedbackdate datetime Datum der OK R ckmeldung SWB unique processingid Tabelle A62 die Tabelle stat_metadatasets 265 C Datenbank Schema des HSSS temp_metadatasets Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV wv y eindeutige Identifikationsnummer f r die Tabelle processingid char 100 y eindeutige Bearbeitungsnummer des Metadatensatzes kindofdocument varchar 30 y Dokumentenart Dissertation Bericht creationdate datetime vi Eingangsdatum des Metadatensatzes lastprocessingdate datetime y Datum der letzten Bearbeitung state varchar 30 y Gesamtzustand des Metadatensatzes lastprocessor varchar 100 y letzter Bearbeiter metada
313. rbehalten bleiben m ssen Eine solche Ausbaustufe soll aber durch eine Session Unterst tzung vorbereitet werden Dies bedeutet gleichzeitig dass Informationen zumindest ber den Zeitraum der Sitzung aufrecht erhalten werden k nnen was bereits die Realisierung einer Reihe von n tzlichen Diensten erm glicht So lie en sich zum Beispiel vom Nutzer verschiedene interessante Treffer seiner Su chen sammeln und k nnten ihm sp ter zusammenh ngend pr sentiert werden Eine sp tere Ausbaustufe k nnte solche Sammlungen sogar ber die Sitzung hinaus f r den Nutzer persistent vorhalten 90 3 3 Architekturdetails 3 3 Architekturdetails Nach dem bis hierher die Gesamtarchitektur auf einem relativ hohen Abstraktions niveau und au erdem sehr generisch betrachtete wurde sollen in diesem Abschnitt konkrete Architekturdetails der Gesamtanwendung betrachtet werden Dazu wird die Gesamtanwendung logisch in eine Server Ebene eine Client Ebene und eine Datenbank Ebene nach dem Drei Schichten Modell von Client Server Anwendungen unterteilt welches Abbildung 18 zeigt Server Apache Tomcat etc Client Browser Abbildung 18 Drei Schichten Modell Die Modellabbildung zeigt die drei zu separierenden Schichten Client Server und Datenbank die sich in der Regel auch auf physisch getrennten Rechnern befinden Diese Einteilung der Anwendung ist allerdings nicht ganz unproblematisch So ge h ren die Java ServerPag
314. rbeitsgruppe Elektronisches Publizieren http www dini de workshops epub epub php3 Dissertationen Online http www dissOnline de JuK Initiative Information und Kommunikation der wissenschaftlichen Fachgesellschaften in Deutschland http www iuk initiative org Jakarta http jakarta apache org 290 Literaturverzeichnis L JB L JD L JSa L JSb L JW L LUa L LUb L LUc L LUd L MD L NC L OAal L OAb L OAc L OAd L OP JavaBeans http java sun com beans JDBC http java sun com products jdbc index html Java Servlet API http java sun com products servlet Java Server Pages JSP http java sun com products jsp Java WebStart http www javasoft com products javawebstart Lucene Search Engine http www lucene com Lucene FAQ http www lucene com faq Lucene Papers http www lucene com papers Lucene Talks http www lucene com talks inktomi METADISS Spezifikation V 1 2 http deposit ddb de metadiss htm Netcraft Server Survey http www netcraft co uk survey Open Archival Information System OAIS http ssdoo gsfc nasa gov nost ref_model html Open Archives Initiative OAT http www openarchives org OAI Protocol for Metadata Harvesting V 1 1 http www openarchives org OAI openarchivesprotocol htm OAI Registration http www openarchives org registration htm Online Publikationsverbund der Region S
315. rd Development Kit JSDK um entsprechende Bibliotheken zu erg nzen die eine Behandlung von XML in Java erlauben Solche Bibliotheken werden von verschiedenen Herstellern angeboten und stehen in der Regel sogar kostenlos und im Quelltext zur Verf gung Die abzudeckenden Funktionalit ten sind dabei das Einlesen und Auswer ten von XML Strukturen realisierbar durch einen XML Parser sowie das Erstellen von XML Strukturen Unter Umst nden k nnte auch ein API zur Transformation von XML XSL XSLT FO Unterst tzung f r die Gesamtanwendung von Interesse sein Die zweite Architekturvision verlangt die Entkopplung aller sich auf Metadaten beziehenden Informationen aus der Anwendung in eine zu definierende XML Struktur als Ausgangspunkt f r die automatisierte Generierung aller von diesen Informationen abh ngenden dynamischen Teile der Anwendung Eine volle Unterst tzung dieser An forderung ist mit einer zus tzlichen Komplexit t von erheblichem Ausma und damit auch mit einem enormen Zeitaufwand verbunden Da die XML Struktur ebenfalls die Generierung der vom Metadatensatz abh ngigen Gesch ftsobjekte und deren Struktur beschreiben m sste ist eine sehr komplexe Ausgangsstruktur von gro er M chtigkeit notwendig in die sehr viel investiert werden m sste Zus tzlich muss diese Komple xit t f r den Anwender entsprechend verborgen werden er soll ja gerade in der Lage sein die dynamischen Teile der Anwendung relativ intuitiv und ohne besondere P
316. rd au erdem an die TIB Technische Informationsbibliothek Hannover bzw an die FU Freie Universit t Berlin verschickt 3 Im weiteren In Abh ngigkeit vom fachlichen Gegenstand der Dissertation 70 3 1 Gesch ftsmodelle und Arbeitsabl ufe Verlauf des Gesch ftsganges erh lt das Referat 3 4 vom Referat 5 3 zwei Pflichtex emplare die bereits vom entsprechenden Fachreferenten klassifiziert wurden 4 F r diese Exemplare initiiert das Referat die lokale Inventarisierung und Katalogisierung indem sie zun chst an das Referat 3 1 Inventarisierung verschickt werden 5 Von dort aus werden sie an das Referat 4 1 respektive Referat 4 2 weitergeleitet wo die Aufnahme in den Katalog erfolgt 3 1 2 Arbeitsablauf f r Berichte Bei dem Arbeitsablauf f r Dissertationen konnten die Arbeitsg nge f r die gedruck te und die elektronische Version des Dokuments sehr gut miteinander synchronisiert und verbunden werden Dies war vor allem deshalb m glich weil durch bestimmte gesetzliche Bestimmungen die Zeitpunkte der Abgabe von gedruckter und elektroni scher Version sehr eng beieinanderliegen und im Idealfall sogar identisch sind Bei der Dokumentenart der Berichte ist dieser Vorteil leider nicht gegeben Es l sst sich keine Aussage ber die Reihenfolge der Abgabe von gedruckten bzw elektronischen Exemplaren eines Dokuments treffen ja nicht einmal eine Aussage dahingehend ob berhaupt eine Druckversion abgegeben wird Aus
317. rektur von Formularen von Vorteil ist um schnell wieder auf das bersichtsformular zu gelangen Les muss aber an dieser Stelle noch einmal darauf hingewiesen werden dass es nicht Ziel dieser Diplomarbeit war produktive Versionen f r die SLUB zu erstellen sondern auf eine prototypische Art und Weise bestimmtes Know How zu sammeln und entsprechend zu demonstrieren 16farbliche Gestaltung in Abh ngigkeit ihrer Notwendigkeit Beschriftung und Kurzhilfe usw Notwendigkeit obligatorisch optional minimales und maximales Auftreten Mindest und H chst l nge etc 18 Die Gr nde sind technischer Natur und stehen im Zusammenhang mit der Server seitigen Validie rung 142 4 5 Einsch tzung e Die im vorangegangenen Kapitel bereits angesprochenen TagLibs w ren insbe sondere auch f r den Einsatz innerhalb der View des MetadatenGenerators ge eignet so dass nderungen am Layout etc noch einfacher und ohne weitere Kenntnisse zu realisieren w ren e Die kontextsensitive Hilfe erh lt bisher nur einen Teil ihrer Informationen aus den Konfigurationsstrukturen Ein anderer Teil wird in Form von integrierten JSP s verwendet Idealerweise w rden diese Informationen in die Datenbank ausgelagert was eine zus tzliche Anwendung zur transparenten nderung dieser Inhalte durch Mitarbeiter des Referates 5 3 notwendig macht 143 5 Teilanwendung 2 AdminTools Inhalt des Kapitels 5 1 Analyse und Design 0
318. ren die notwendigerweise auch f r alle Abbildungen gleich ist Zwar lie e sich diese Abbildungsfunktion im Nachhinein auch ndern dann aber nur f r alle Abbil dungen Der gro e Vorteil und die besondere Eleganz des ersten Ansatzes besteht hingegen darin dass er auf keine externen Informationen angewiesen ist und damit auch keine Zeit vergeuden muss diese zu erlangen Stattdessen besteht die Abbildung aus einer relativ simplen Berechnung im Hauptspeicher und ist entsprechend perfor mant Ein noch gr ere Vorteil besteht darin dass der Abbildungsvorgang bis auf die Komplexit t der Abbildungsfunktion berhaupt nicht von der Menge der m glichen Abbildungen abh ngig ist Die Abbildung konzentriert sich immer auf die momentan abzubildende absolute URL unabh ngig davon ob diese die einzige oder eine unter 100000 im Gesamtsystem ist Zusammenfassend lassen sich f r die beiden Ans tze also die folgenden haupts chlichen Vor und Nachteile ermitteln die in Tabelle 11 auf der folgenden Seite dargestellt sind 2da es strenggenommen berhaupt keine formalistische Abbildungsfunktion gibt 3Die praktische Relevanz dieser theoretischen berlegung wird schnell klar wenn mann sich ei ne Abbildungsfunktion berlegt die eine bestimmte Verzeichnisstruktur auf einem bestimmten Webserver A berechnet Es ist nicht ohne weiteres m glich einen Teil der absoluten URL S auf URL s des Webservers A abzubilden und gleichzeitig einen anderen Teil auf
319. ren Datens tze anzuzeigen gt Verkn pfungen muss kann nicht Erm glicht durch logische Operatoren eine Eingrenzung der Suchergebnisse muss der Begriff muss im Suchfeld enthalten sein kann der Begriff kann im Suchfeld enthalten sein nicht der Begriff darf nicht im Suchfeld enthalten sein gt Report Erm glicht Anzeige detailierter Informationen zum Datensatz gt Ergebnisgr e Grenzt die Anzahl der zu zeigenden Datens tze je Seite ein gt Datum Grenzt den Ver ffentlichungszeitraum ein vzur ck v Intemet Abbildung 59 myHSSS Hilfe in der Einzel Ansicht Die Navigation zwischen den beiden Ansichten erfolgt wieder ber die aufw rts gerichteten Pfeile diesmal bei dem Button Hilfe siehe z Bsp Abbildung 57 respektive durch zur ck bzw den abw rtsgereichteten Pfeilen in Abbildung 59 200 6 3 Realisierung Die vierte Architekturvision welche eine Portall sung die Integration externer Dienste und eine weitgehende Personalisierung verlangte wurde schon in Abschnitt dahingehend gemildert dass lediglich eine Session basierte Umsetzung realisiert werden soll welche aber die sich daraus ergebenden M glichkeiten andeutet Im Rah men der Diplomarbeit wurde eine interessante Funktionalit t umgesetzt die es erlaubt einzelne Suchergebnisse auch aus verschiedenen Suchen wie etwa Volltextsuche oder Feldsuche zu sammeln Das bedeutet dass diese Treffer innerhalb der Sessi
320. req HttpSe produceListMetadataFormatsRes OAlSet MetadataFormat produceListldentifiersResult req produceListRecordsResult req Ht gt OAISet OAlSet spec String name Stri getNodes ns Namespace Lisi containsSpec spec String OA getNode prefix String ns Namg MetadataFormat MetadataFormat prefix String sc Thread ResumptionCleaner metadataPrefix String metadataSchema String metadataNamespace String metadataTagname String setSpecification String setName String subSets Map Abbildung 62 HSSS Package oai Da das OAI Protokoll HTTP als Tr gerprotokoll benutzt wird eine Anwendung ben tigt die sowohl HTTP als auch die Spezifika des OAI Protokolls versteht In nerhalb des HSSS Gesamtsystems wurde diese Anwendung selbstverst ndlich in Form eines Servlets realisiert Die Klasse OAIServlet die von HttpServlet erbt ist also die eigentliche OAI Schnittstelle des HSSS die allerdings weitere Klassen integriert die im Folgenden vorgestellt werden Alle wesentlichen Funktionalit ten wie etwa das Parsen der OAI Befehld bzw der weiteren Parameter sowie das Initiieren der ent sekennzeichnet durch den ausgezeichneten Parameter verb 210 7 1 Objektorientierte Analyse und Design sprechenden Reaktioneif werden aber bereits durch das OAIServlet realisiert Die meisten OAI spezifischen Archivinformationen werden dem Servlet dabei ber die web xml bekannt gemacht so dass diese
321. resden de content html lt URL gt lt content gt lt metadataPolicy gt lt text gt Metadata may be used by commercial and non commercial service providers lt text gt lt URL gt http hsss slub dresden de hsss oai policy metadata html lt URL gt lt metadataPolicy gt lt dataPolicy gt lt text gt Full content i e doctorals may not be harvested by robots Please pay attention to the copyright lt text gt lt URL gt http hsss slub dresden de hsss oai policy data html lt URL gt lt dataPolicy gt lt submissionPolicy gt El ei Fertig Intemet Abbildung 63 XMI Struktur der Antwort auf eine Identify Anfrage Wie deutlich zu sehen ist besteht die Antwort aus einer bestimmten XML Struktur die in die HTTP Antwort eingebettet wurde Die XML Struktur ist in einem inter nationalen Unicode Format UTF 8 kodiert die HTTP Antwort allerdings in ISO 8859 1 um auch deutsche Umlaute darstellen zu k nnen Die Antwort enth lt Infor mationen ber das Archiv wie etwa Archivname repositoryName die Basis URL der Anwendung baseURL oder die implementierte Protokollversion protocolVersion usw die einem Service Provider wichtige Hinweise liefern um die Daten des Archivs korrekt auswerten und entsprechende Dienste anbieten zu k nnen Eine Mimimalim plementation eines solchen Dienstes ist in Abbildung 64 zu sehen sie erlaubt es eine 215 7 Implementierung des OAI Protokolls b
322. ro grammierkenntnisse zu erstellen bzw zu ndern Dies wird h chstwahrscheinlich ein 88 3 2 Architekturtibersicht weiteres ebenfalls sehr komplexes Werkzeug zur Entwicklung nderung von Metada tens tzen notwendig machen Die Erstellung von Anwendungsteilen zur Laufzeit ver langt weiterhin zus tzliche zum Teil sehr aufwendige Strategien zum Management dieser Vorg nge Deshalb muss diese Architekturvision f r das Diplom etwas einge schr nkt werden Es sollen nur die Teile realisiert werden die sich mit relativ wenig Aufwand entwickeln lassen dabei aber einen gro en Nutzen f r die Gesamtanwendung versprechen Dazu geh rt auf jeden Fall die strukturelle Beschreibung von Meta datens tzen in XML Zus tzlich soll diese XML basierte Metadatensatzbeschreibung Parameter enthalten die zwar keine automatisierte Erstellung von Anwendungsteilen oder Persistenzstrukturen erm glichen aber statisch vorhandene Klassen von au en entsprechend modifizieren k nnen so dass eine Funktionalit t in Abh ngigkeit des Metadatensatzes entsteht Solche Parameter wurden in den Architekturvisionen zum Teil beschrieben und k nnten insbesondere die grafische Benutzerschnittstelle und die Validator Klassen beeinflussen Alle weiteren M glichkeiten sollten zu einem sp teren Zeitpunkt wieder in Betracht gezogen werden unter Umst nden auch von einer ande ren Institution als der SLUR Dabei muss noch einmal hervorgehoben werden dass die volle
323. ronisches Publizieren im bibliothekarischen Umfeld Dimensionen beinhalten 1 Sogenannte Data Provider unterst tzen das OAI Protokoll dergestalt dass sie Metadaten Informationen ber ihre Daten und Inhalte Archive zur Verf gung stellen Zus tzlich k nnen sich solche Institutionen bei der OAI registrieren lassen um den Fakt dass sie in dieser Form das OAI Protokoll unterst tzen ffentlich zu machen 2 Sogenannte Service Provider verteilen Dienstanfragen an die Data Provider und nutzen die erhaltenen Metadaten als Basis f r Mehrwertdienste Auch ein Service Provider kann sich bei der OAI registrieren um seine Existenz zu publi zieren Daraus wird schon deutlich dass es f r eine Bibliothek die zum Beispiel einen eige nen Dokumentenserver f r digitale Hochschulschriften aufbaut durchaus Sinn macht sich mit dem Open Archives Metadata Harvesting Protocol vertraut zu machen um gegebenenfalls als Data Provider an einem dezentralen Verbund von verschiedenen Archiven teilnehmen zu k nnen indem man Metadaten ber die eigenen Inhalte zur Verf gung stellt Eine Bibliothek k nnte nat rlich auch als Service Provider auftre ten indem sie zum Beispiel eine Metasuche ber ihr eigenes Archiv und das beteiligter Institutionen erm glicht Die Idee verschiedene lokale Archive ber ein gemeinsames Protokoll miteinander zu verbinden und somit virtuell einen globalen Zugriff zu realisieren ist nat rlich alles andere
324. rovider aufzutreten Es ist von allen Archiven zumindest das Metadatenformat nach Dublin Core zu unterst tzen Jede Ressource des Archivs ist langfristig stabil erreichbar d h es ist eine Indirektion zu realisieren die dazu f hrt dass die Ressource selbst bei einer nderung der physischen Persistenz immer unter dem selben Identifier erreichbar ist Jedes Archiv garantiert technisch f r eine Mindestverf gbarkeit in einem tolerierbaren Bereich ca 99 Zus tzlich zu diesen Mindestanforderungen sollte die Organisation weitere optio nale Anforderungen spezifizieren Vielleicht k nnte wie bei einigen Protokollen blich der Grad der bereinstimmung der Implementation mit den Anforde rungen in verschiedenen Leveln angegeben werden Je h her das Level ist das ein Archiv implementiert desto gr er sollte die Unterst tzung und F rderung durch die Organisation sein e Alle Archive sind durch die Organisation durch entsprechende Tests der Imple mentation zu zertifizieren Die Archive sollten aber auch nach der Zertifizierung in unregelm igen Abst nden m glichst automatisiert berpr ft und getestet werden e Die Organisation selber sollte Dokumentationen und Hilfestellungen zur Verf gung stellen Au erdem sollte sie eine Referenzimplementation eines wissen schaftlichen Archivs ffentlich machen welches als Beispiel oder als Grundlage einer eigenenen Entwicklung f r beliebige Institut
325. rst mit einem anschlie endem Klicken auf Weiter von der Anwendung bernommen werden In jedem einzelnen Formular hat der Nutzer Hinweise zu den Gr nden f r dieses Design finden sich in Schb00 129 4 Teilanwendung 1 MetadatenGenerator zudem die M glichkeit spezielle Hilfe zu bestimmten Themen iiber das Fragezeichen oder allgemeine Hilfestellungen ber den Hilfe Button zu erhalten Ein Hilfefenster ist in der folgenden Abbildung 35 zu sehen 3 SLUB Metadatengenerator Hilfe Microsoft Internet Explorer Ha Aa AAA Abbildung 35 SLUB MetadatenGenerator Hilfe Diese Abbildung zeigt die kontextsensitive Hilfe wie sie sich bei einem Klick auf das Fragezeichen Symbol hinter dem Dublin Core Subelement DC Title Alternative pr sentieren wiirde Es erfolgt jeweils eine kurze Beschreibung die sich automatisch aus der Metadatensatzbeschreibung ergibt sowie einige Angaben zu Attributen des jeweiligen Subelements auch diese ergeben sich aus der Metadatensatzbeschreibung und passen sich daher eventuellen nderungen automatisch an Danach wird ein vollst ndiges Beispiel f r das jeweilige Subelement in demselben Design gezeigt wie es sich dem Autor auch innerhalb des MetadatenGenerators pr sentiert Desweiteren kann der Autor in der Hilfe unabh ngig navigieren um sich beispielsweise ber weitere Subelements zu informieren unter Umst nden sogar ber solche anderer Dokumenten arten
326. rukturen wird von der OAI Protokoll Spezifikation nicht vorgeschrieben Hier hat allerdings die DINI in einem Arbeitspapier DINa01 vorgeschlagen f r alle deut schen Archive einheitliche Set Definitionen zu nutzen und schl gt vor folgende formale bzw inhaltliche Sets anzubieten 1 Formaler Set Damit sind formale Kriterien gemeint die den Publikationstyp n her beschrei ben f r den HSSS sind das e Dissertation Dissertation Habilitation e Bericht Forschungsbericht Studie etc Erstellen der entsprechenden XML basierten Protokollantworten auf die OAI Protokollanfragen bzw der Fehlermeldungen bei fehlenden oder unkorrekten Parametern 3etwa Archivname implementierte Protokollversion Archiv Url Inhaltsbeschreibungen Beschrei bungen der rechtlichen Bedingungen usw 47 Bsp Dublin Core als das OAI Pflicht Metadatenformat 211 7 Implementierung des OAI Protokolls 2 Qualitativer Set Soll sp ter in Anlehnung an sogenannte Quality Schemes erfolgen allerdings scheinen die Elemente noch nicht vollst ndig festgelegt zu sein 3 Inhaltlicher Set Die grobe inhaltliche Einordnung soll eine fachliche Selektion ber das OAI Protokoll erm glichen DINI schl gt vor diese Strukturierung den DNB Sach gruppen nachzuempfinden z Bsp Ausschnitt e 01 Wissenschaft und Kultur allgemein e 11 Psychologie e 17 Wirtschaft e 28 Informatik Datenverarbeitung e USW Die Sets 1 und 3 der Aufz hlung w
327. s sifikationen Diese Tabelle enth lt alle beteiligten universit ren Einrichtun gen Diese Tabelle enth lt alle beteiligten Universit tsbibliotheken Tabelle A56 Tabellen bersicht Teil 1 261 C Datenbank Schema des HSSS Tabelle BESCHREIBUNG pers_type pers_metadatset pers_title pers_fulltext pers_date_metadataset pers_description_metadataset pers_format_metadataset pers_person_metadataset pers_publication_metadataset pers_relation_metadataset pers_subject_metadataset pers_title_metadataset Diese Tabelle enth lt alle Dokumententypen die Dokumente narten zugeordnet sind Diese Tabelle enth lt eindeutige Attribute eines Metadaten satzes Diese Tabelle enth lt alle verwendeten Titel Diese Tabelle enth lt die Volltexte zu den Hochschulschriften falls verf gbar Diese Tabelle enth lt Zuordnungen von Daten zu Metadaten s tzen und deren Typ Pr fungstag Abgabetag Ver ffentli chungsdatum Diese Tabelle enth lt Zuordnungen von Beschreibungen zu Metadatens tzen und deren Typ deutsche Beschreibung eng lische Beschreibung Diese Tabelle enth lt Zuordnungen von Dokumentenformaten zu Metadatens tzen und deren Typ bermittelte Formate Pr sentationsformate Originalformate Diese Tabelle enth lt Zuordnungen von Personen zu Metada tens tzen und deren Typ bzw Rolle Autoren Gutachter Pr fer Diese Tabelle enth lt Zuordnungen von Ver ffentlichungen zu M
328. s Abschnitt deutlich wird geh ren zu den Diensten des HSSS insbesondere drei unterscheidbare Teilanwendungen siehe auch Abbildung 1 e Die erste Teilanwendung beinhaltet die Unterst tzung der Autoren bei der ber mittlung der Metadaten zu ihrer Hochschulschrift an die SLUB Diese Teilanwen dung wurde im Rahmen der Belegarbeit bereits vollst ndig realisiert e Die zweite Teilanwendung realisiert die administrative Verwaltung Bearbeitung und Validierung aller Metadaten vom Eintreffen bis hin zur persistenten Spei cherung Diese Teilanwendung wurde von der Belegarbeit nur zum Teil imple mentiert e Die dritte Teilanwendung soll den Zugriff auf alle Hochschulschriften und deren Metadaten im HSSS realisieren Sie wurde in der Belegarbeit noch gar nicht behandelt und stellt einen thematischen Schwerpunkt in der Diplomarbeit dar Gesamtanwendung HSSS Teil Teil Teil anwendung anwendung anwendung 1 2 3 tempor re Persistenz Persistenz Abbildung 1 schematische Darstellung der HSSS Gesamtanwendung direkt nachdem sie vom Autoren mit Hilfe der ersten Teilanwendung erstellt wurden 30 2 2 Interpretation der Aufgabenstellung Soweit es der zeitliche Rahmen der Diplomarbeit zul sst sollen die schon in der Be legarbeit angesprochenen Verbesserungsm glichkeiten ber cksichtigt werden um ein insgesamt m glichst stabiles und stimmiges System zu realisieren siehe dazu auch Abschnitt 2 3 Einige Bereich
329. s Package in jeweils separaten Packages den Zugriff auf externe APT s in den Packages db ftp Lucene mail und xm1 Im folgenden sollen nur die Packages in ihrer Struktur und Funktion ein wenig n her betrachtet werden die sich auf die gesamte Anwendung beziehen die Packages der Teilanwendungen werden sp ter in separaten Kapiteln beschrieben Abbildung 22 auf der folgenden Seite zeigt das Klassendiagramm des Packages persistence ausschnittsweise Dieses Package dient insbesondere der Interaktion mit dem Teil der Konfigurationsstrukturen der in hsssdata xml enthalten ist siehe auch Abschnitt B 3 im Anhang Wie aus der Abbildung ersichtlich wird werden zwei Persistenzarten 101 3 Systemarchitektur unterst tzt d h die Konfigurationsstruktur kann sowohl dateibasiert als auch daten bankbasiert vorliegen und wird von einer jeweils spezialisierten Klassq entsprechend behandelt eingelesen und steht danach der entsprechenden Teilanwendung ber Me thoden wie getSupportedLanguages alle vom HSSS unterst tzten Sprachen oder getSupportedFormats alle vom HSSS unterst tzten Dokumentenformate usw zur Verf gung interface HsssData init config ServletConfig void getSupportedLanguages lterator HsssDataFactory factory HsssDataFactory HsssDataFactory getinstance HsssDataFactory createHsssData config ServletConfig getSupportedFormats lterator getSu
330. s Such begriffs in den zu durchsuchenden Feldern ab Der Rang bzw die Nummer des Treffers innerhalb der Ergebnismenge steht in direktem Zusammenhang mit diesem Wert 203 6 Teilanwendung 3 HSSS AccessTools myHSSS Felder n her benannt sind Dadurch ergeben sich innerhalb der Volltextsuche die folgenden Suchmodj nur Volltext Es wird nur der Volltext der Hochschulschrift durchsucht Feld fulltext innerhalb der Lucene Dokumente nur Felder Es werden alle indizierten Felder durchsucht mit Ausnahme des Volltext Feldes fulltext Felder und Volltext Es werden alle indizierten Felder von Lucene durchsucht e Feldsuche Die Feldsuche erlaubt die fein abgestimmte Suche in bestimmten Feldern des Index Es lassen sich separate Anfragen fiir die Felder Titel Lucene Dokumentenfeld title Autor Lucene Dokumentenfeld creator Beschreibung Lucene Dokumentenfeld description Schlagwortd Lucene Dokumentenfeld subject bilden und durch die Konjunktionen muss kann oder nicht beliebig mitein ander verkn pfen siehe auch Abschnitt 6 2 1 Dadurch k nnen hochkomplexe Gesamtanfragen entstehen e Navigation Die Navigation ist sehr einfach implementiert und erlaubt alle Treffer f r be stimmte Kategorien anzuzeigen Diese Kategorien sind alle Ver ffentlichungsjahre z Bsp alle Hochschulschriften des Jahres 2000 alle Fakult ten z Bsp alle Hochschul
331. s mit einer bestimmten Feld struktur Tabelle 12 zeigt die f r die dritte Teilanwendung definierten Dokumenten felder und deren Inhalt Feld INHALT identifier die absolute URL der Hochschulschrift fulltext der Volltext der Hochschulschrift title Originaltitel alternative Titel und bersetzte Titel der Hochschulschrift subject Schlagworte eigene SWD und Klassifikationen DNB RVK der Hochschulschrift description Beschreibungen der Hochschulschrift creator der die Autor en der Hochschulschrift advisor der Betreuer der Hochschulschrift referee die Gutachter der Hochschulschrift date das Ver ffentlichungsdatum der Hochschulschrift type der Dokumententyp der Hochschulschrift Tabelle 12 Dokumentenfelder und Inhalte 20Da die vierte Kombination required true und prohibited true nicht sinnvoll und daher verbo ten ist 192 6 2 Objektorientierte Analyse und Design Bei Feldern die mehrere logisch zu trennende Informationen beinhalten wie etwa title oder subject oder die eine Menge von Werten enthalten k nnen beispielsweise subject oder referee werden die einzelnen Entit ten durch eine Separator Zeichenfolge getrennt um sie sp ter auf einfache Weise logisch trennen zu k nnen F r Dokumen te mit den beschriebenen Feldern wird vom LuceneManager ein Index erstellt der als eigenes Verzeichnis realisiert ist durch FSDirectory Es existieren zwei M glichkei ten den Volltextindex des HSSS zu beeinflussen
332. schriften der Fakult t Wirtschaftswissenschaften alle Dokumententypen z Bsp alle Hochschulschriften der Dokumentenart Habilitation e Meine Treffer Erm glicht die Betrachtung aller w hrend einer Sitzung gesammelten Treffer sowie deren L schung 30obwohl dies explizit innerhalb der Suchanfrage m glich ist siehe dazu die Syntax von Suchanfragen in Abschnitt 6 2 1 3ldiese Suchen gehorchen einer internen Oder Semantik 32auch Klassifikationen damit ergibt sich eine interessante Suchm glichkeit f r einen Bibliothekar 204 6 4 Einsch tzung 6 4 Einsch tzung Bei der dritten Teilanwendung handelt es sich um die j ngste der drei Teilanwendun gen des HSSS die erst vollst ndig w hrend der Diplomarbeit konzipiert und entwickelt wurde Aus diesem Grund treffen auf sie die Merkmale einer prototypischen Realisie rung im Besonderen zu Bevor dieser Abschnitt auf die zahlreichen Verbesserungen und Erweiterungen eingeht die hier m glich sind sollen die positiven Eigenschaften der dritten Teilanwendung gew rdigt werden So konnte die dritte Architekturvision recht berzeugend umgesetzt werden wenn gleich sich die bereits angedeuteten Schwierigkeiten bei der Skalierung von Grafiken ergaben Hier ist eine wirklich n tzliche Funktionalit t realisiert worden die als Bei spiel f r die Gestaltung variabler Benutzerschnittstellen auch f r zuk nftige Weiterent wicklungen an den beiden and
333. sesch ftsgang in Bezug auf das Referat 5 3 Teil 2 69 Abbildung 7 Anwendungsfalldiagramm Kontext des Systems f r das Referat 3 4 2 2 22 22 70 Abbildung 8 Sequenzdiagramm Gesch ftsgang in Bezug auf das Referat 34 2 2 2 2 2 222 70 Abbildung 9 Sequenzdiagramm Gesch ftsgang f r Berichte Teil 1 72 Abbildung 10 Sequenzdiagramm Gesch ftsgang f r Berichte Teil 2 73 Abbildung 11 Doppelte Titelaufnahme einer Ressource 75 Abbildung 12 Einheitliche Titelaufnahme einer Ressource 76 Abbildung 13 Trennung von Inhalt Repr sentation 76 Abbildung 14 Komponentenmodell der HSSS Gesamtanwendung 78 Abbildung 15 Systemkomponenten im Schichtenmodell 79 Abbildungsverzeichnis Abbildung 17 Einfluss der Metadatensatzbeschreibung TE RADA 83 Abbildung 18 Drei Schichten Modelll e 91 0 100 Abbildung 21 HSSS ichnishi 1 101 Abbildung 22 HSSS Package persistence Ausschnitt 102 Abbildung 23 HSSS Package utilities Ausschnitt 103 Abbildung 24 HSSS Package xml Ausschnitt 104 DEE 106 NEE SEN 106 Abbildung 27 HSSS Package temporalpersistence Ausschnitt 107 Abbildung 28 Architektur page centric approach 2 Tier 108 Abbildung 29 Architektur dispatcher approach MVC
334. sierungen jeweils kurz beschreiben 4 4 1 Evaluation Am Ende des in Abschnitt beschriebenen Vorgangs der Erstellung der Prim r Metadaten durch den Autor wird diesem bei erfolgreicher Speicherung eine Web Seite mit einer Best tigung pr sentiert Die Anwendung erlaubt es zus tzlich in diese Seite ein Formular einzubinden welches den Autor entscheiden l sst ob er vor Beendigung der Teilanwendung noch eine bestimmte Ressource im Netz aufsuchen will Ob eine solche Erweiterung angezeigt werden soll ist in den Konfigurationsstrukturen einstell bar daneben auch die URL der Ressource und die Beschriftung des Formulars In der gegenw rtigen Version des MetadatenGenerators wird diese M glichkeit dazu genutzt ein Formular mit der Beschriftung Fragebogen anzeigen und vorselektierter Check box in die Seite zu integrieren Bel sst der Autor die Selektion f hrt ihn der Klick auf Beenden zun chst auf eine Seite auf der er die Teilanwendung Metadaten Generator evaluieren kann siehe Abbildung 38 auf der folgenden Seite Diese Befragung erfolgt anonym und dient dazu von den Autoren ein Feedback ber die Qualit t und Benutzerfreundlichkeit des MetadatenGenerators zu bekom men Deaktiviert der Autor die Vorselektierung kann er die Teilanwendung mit Beenden normal verlassen Auch wenn die Evaluation sp ter einmal nicht mehr ben tigt wird kann diese Erweiterung durch die m gliche Konfigurierbarkeit sinnvoll genutzt werden
335. sion nicht gerecht werden F r den ersten Fall ist es an verschiede nen Stellen zu ungenau und fachlich nicht fundiert genug f r den zweiten Fall fehlt es an der n tigen Praxisorientierung und an einfachen berschaubaren Beispielen zudem ist das Dokument in diesem Fall viel zu umfangreich und unausgewogen Vielleicht w re es eine L sung zwei Versionen des Dokuments zu erstellen eine Version die umfangreich und sehr detailliert alle zugrundeliegenden Technologien beschreibt und eine zweite Version die als kurzes pointiertes Extrakt der ersten Version mit vielen hilfreichen Beispielen versehen ist und als echtes Empfehlungspapier bzw Leitfa den f r die Praktiker dient Neben diesen Kritikpunkten enthalten die betrachteten Empfehlungen aber auch viele hilfreiche Informationen die auch f r den Aufbau des HSSS von Interesse sind Auf diese Punkte wird im Abschnitt 2 4 5 auf Seite 58 n her eingegangen 2 4 3 Dissertationen Online Das Projekt Dissertationen Online ist aus einer Initiative der uK Kommission der deutschen wissenschaftlichen Fachgesellschaften L IUK hervorgegangen und wurde von 1998 bis 2000 von der Deutschen Forschungsgemeinschaft L DF gef rdert Da bei untergliederte sich das Projekt in 8 verschiedene Teilprojekte die sich unter ande rem mit den Themen Metadaten Formate Retrieval Multimedia sowie Beratung und Unterst tzung auseinandersetzten Seit dem Ende der F rderung sollen die
336. sistence Abbildung 20 HSSS Package Struktur Die Abbildung zeigt die Packages innerhalb des Package hsss welches das oberste in der Package Hierarchie der Gesamtanwendung ist die Package Struktur entspricht auf Dateisystem Ebene der Verzeichnishierarchie welche zum besseren Ver st ndnis der Struktur in Abildung 21 gezeigt wird Zu erkennen ist dass jeweils ein separates Package fir die Teilanwendungen MetadatenGenerator AdminTools und Details zur objektorientierten Analyse und Design der Teilanwendungen finden sich in den die entsprechende Teilanwendung jeweils speziell betreffenden Kapiteln 43Ein Package Paket bezeichnet in Java eine Menge von Klassen die zueinander in einer besonderen engen Beziehung stehen 100 3 3 Architekturdetails Access Tools existiert metadatagenerator admintools und accesstools so wie ein Package oai f r die Implementation des OAI Protokolls Innerhalb der Packages sind gegebenenfalls auch die Namen eventuell enthaltender Packages sicht bar Die Packages der Teilanwendungen zum Beispiel enthalten jeweils ein Package namens utilities welches spezifisch auf die Teilanwendung zugeschnittene Hilfs klassen enth lt Daneben existieren mit metadatset temporalpersistence persistence und utilities weitere Packages die f r die gesamte Anwendung von Bedeutung sind sich also nicht einzelnen Teilanwendungen explizit zuordnen las
337. sprache Die Frage ist ob wirklich sichergestellt werden kann ob das entstehenden Layout dem urspr nglichen Layout des Autors ex akt gleicht was von der Mehrheit der Autoren erwartet wird Falls dies nicht garantiert werden kann steht zu bef rchten dass ein solcher Ansatz langfristig nicht akzeptiert wird Eine Kompromissl sung w re unter Umst nden eine zweigleisige Strategie zu verfolgen indem das Druckformat respektive Pr sentationsformat auf herk mmliche Weise aus dem Original erstellt wird ohne strukturelle oder semantische Informatio nen zu nutzen und die Auszeichnungssprache nur f r Formate verwendet wird die 23Gerade auch im Hinblick auf die im Abschnitt 2 4 aut Seite 36 getroffenen Feststellungen in Bezug auf Langzeitarchivierung ist diese Tatsache von grofer Bedeutung 54 2 4 Digitale Archive und elektronisches Publizieren im bibliothekarischen Umfeld davon auch tats chlich profitieren k nnen Dies w rde Sinn machen wenn man bedenkt dass ein Pr sentationsformat im Sinne eines Druckformats die zus tzlichen semantischen bzw strukturellen Kontextinformationen eigentlich nicht ben tigt da seine einzige Aufgabe darin besteht das Layout des Dokuments so exakt wie m glich zu kodieren 2 4 4 Subjektive Einsch tzung der betrachteten Initiativen und Entwicklungen Leider f llt das Res mee der betrachteten Initiativen im Umfeld des Diplomthemas nicht sehr positiv aus Generell mangelt es gerade f
338. ssers Bezeichnung ADRESSE DES VERFASSERS Beschreibung Die Adresse eines Verfassers DC Bezeichnung DC Creator PersonalName Address Parametername dc_creator_personalname address Metadatentyp primary nicht genutzt Regulation optional H ufigkeit 0 10 L ngenrestriktion 10 255 Tabelle A9 HSSS Metadatensatz Adresse des Verfassers A 2 3 DC SUBJECT Bezeichnung EIGENE SCHLAGWORTE DEUTSCH Beschreibung Freie selbstdefinierte Schlagworte in deutscher Sprache DC Bezeichnung DC Subject Parametername dc_subject ger Metadatentyp primary Regulation mandatory H ufigkeit 1 10 L ngenrestriktion 3 100 Tabelle A10 HSSS Metadatensatz Eigene Schlagworte deutsch 233 A Metadatens tze des HSSS Bezeichnung EIGENE SCHLAGWORTE ENGLISCH Beschreibung Freie selbstdefinierte Schlagworte in englischer Sprache DC Bezeichnung DC Subject Parametername dc_subject_eng Metadatentyp primary Regulation mandatory H ufigkeit 1 10 L ngenrestriktion 3 100 Tabelle A11 HSSS Metadatensatz Eigene Schlagworte englisch Bezeichnung DNB KLASSIFIKATION Beschreibung DC Bezeichnung Parametername Metadatentyp Regulation H ufigkeit L ngenrestriktion Klassifikation der DNB Sachgruppe zwingend erforderlich weil f r den Austausch ben tigt DC Subject de subject duh secondary mandatory 1 10 3 100 Tabelle A12 HSSS Metadatensatz DNB Klassifikati
339. ssystem auszuw hlen das sich m glichst gut in die verwendete Entwicklungsumgebung einpasst Die bisherige dateibasierte L sung muss abgel st werden da sie f r den gleichzeitigen Zugriff verschiedener Benutzer Autor SLUB Leser und die Suche nicht ausreichend Unterst tzung bietet Damit entsteht die Notwendigkeit ein Datenbankschema zu entwerfen Hier sind auch die M glichkeiten von XML zu pr fen XML k nnte die Generierung der ver schiedenen Sichten auf die Daten und die unterschiedlichen Layouts sehr unterst tzen Die Ablage der Dokumente ist dabei auch in dieser Arbeit noch keine Aufgabe f r die Datenbank sie erfolgt weiter in Dateien auf die aus der Datenbank heraus verwiesen wird Dabei ist der Dateiname vollst ndig zu verbergen weder der Autor noch der Le ser sollen ihn jemals erfahren Statt dessen erhalten sie eine stabile URL zu der Schrift die sich ber Jahre hinweg nicht ndern soll auch wenn die Dateistrukturen intern ge ndert werden Es ist deshalb eine Indirektion zu realisieren ggf unter Einbeziehung der Datenbank die die URL auf den Dateinamen abbildet Genauer sollte diese URL zun chst auf eine sog Frontdoor der Schrift f hren also eine HTML Seite die alle Angabe zu dieser Schrift enth lt und auch einen Link zum Dokument selbst evtl in mehreren Formaten PDF PostScript HTML sp ter vielleicht XML Nachdem die Angaben in der Datenbank vollst ndig sind das Dokument in einem Verzeichnis lie
340. t 17 Danach ist die Dissertation ber die noch zu entwickeln de Webschnittstelle f r Browsing Suche und Navigation weltweit langfristig verf gbar Das Referat 3 4 ist der letzte Akteur der genauer anhand von UML Diagrammen im Kontext des Gesch ftsmodells betrachtet wird Abbildung 7 zeigt zun chst alle f r das Referat 3 4 relevanten Anwendungsf lle SLUB Gesch ftsmodell f r Dissertationen i Verschicken von Pflichtexemplaren an externe Institutionen gt q Referat 3 4 DDB x Initiieren der Inventarisierung Katalogisierung x Referat 3 1 TIB FU Referat 4 1 Abbildung 7 Anwendungsfalldiagramm Kontext des Systems f r das Referat 3 4 7 Au erdem erstellt er in der Verbunddatenbank auf Basis des exportierten Metadatensatzes einen neuen Eintrag Sein Abrufzeichen die sogenannte rem Eintragung 69 3 Systemarchitektur Die zwei dem Referat 3 4 zuzuordnenden Anwendungsf lle sind zum einen das Ver schicken von Pflichtexemplaren Druckexemplaren der Dissertation an die externen Institutionen DDB Die Deutsche Bibliothek und TIB Technische Informationsbi bliothek Hannover bzw FU Freie Universit t Berlin und zum anderen das Initiieren der Inventarisierung bzw Katalogisierung der sacherschlossenen bzw klassifizierten Druckexemplare die im Hause verbleiben Das in Abbildung 8 gezeigte Sequenzdia gramm verdeutlicht die dazugeh rigen Aktionen in ihrer zeitlichen Reihenfolge Referat 3 1 Referat 4
341. t MapingServlet wird vom Servlet Container dessen init Methode aufgerufen Innerhalb dieser Methode initialisiert das Serv let eine Instanz vom Typ UrlMapper innerhalb eines neuen Threads welche zus tz lich bestimmte Informationen aus der Konfigurationsdatei web xml erh lt die dem Mappingservlet zug nglich sind Au erdem erh lt das UrlMapper Objekt eine Refe renz auf die noch leere Datenstruktur die das Servlet zur Abbildung von absoluten auf reale URL s verwendet S mtliche Zugriffe zum Aufbau und zur Aktualisierung der Datenstruktur die alle Tupel von absoluten und realen URL s enth lt werden vom UrlMapper parallel zum Servlet innerhalb eines eigenen Threads realisiert Bei der Initialisierung greift dieses Objekt sofort auf eine spezielle gespeicherte Prozedur innerhalb der Datenbank zu welche die Menge aller Abbildungen zur ckliefert sowie das zahlenm ig gr te id Attribut der Tabelle pers_metadataset siehe Abschnitt bzw Kapitel C Die Menge der Abbildungen wird in eine interne Datenstruktur eine Hashtabelle berf hrt die vom selben Typ ist wie die Referenz auf die Daten struktur des Servlets Ist der Aufbau der Datenstruktur des UrlMappers beendet wird die durch die Referenz spezifizierte Datenstruktur aktualisiert 6Diese Datenstruktur ist durch einen Semaphor synchronisiert und dadurch Thread sicher Die Aktualisierung erfolgt durch eine vom Java API bereitgestellte Methode welche einer Hashtabelle eine
342. t gt 40 i al lt SubElements gt 42 lt Element gt 43 44 lt MetadataSet gt Listing A1 formale XML Struktur eines Metadatensatzes 256 B 5 oaisets xml Bh oaisets xml Die Konfigurationsstruktur oaisets xml beschreibt die optionale Set Struktur der Im plementation des OAI Protokolls Diese Set Structure entspricht den Vorschl gen der DINI f r deutsche wissenschaftliche Archive DINa01 Die Umsetzung in eine XML Struktur bot sich angesichts der starken XML Ausrichtung der gesamten Anwendung an und hat den Vorteil dass die Struktur von au en nderbar bleibt ohne Eingriffe in die Anwendung vornehmen zu m ssen Die Konfigurationsstruktur besteht aus hierarchisch geschachtelten set Strukturen Jede set Struktur besteht dabei aus den Tags setSpec Spezifikation des Sets und setName Name bzw Beschreibung des Sets sowie optional aus weiteren rekursi ven Set Strukturen Zur Zeit ist aber nur eine Hierarchietiefe von 2 realisiert Die inhaltliche Bedeutung der einzelnen Sets wurde bereits in Kapitel 7 1 betrachtet 1 lt xml version 1 0 encoding ISO 8859 1 gt 2 lt oaisets gt 3 lt set gt 4 lt setSpec gt pubtype lt setSpec gt 5 lt setName gt Publicationtype lt setName gt 6 lt set gt 7 lt setSpec gt Dissertation lt setSpec gt 8 lt setName gt Dissertationen Habilitationen lt setName gt 9 lt set gt 10 lt set gt 1 lt setSpec gt Bericht lt setSpec gt 2 lt setN
343. t hier dass eine korrekte Normalisierung verlangt dass sich beispielsweise eine Beschreibung nur aus Fremdschl sseln der Wort Tabelle und der Stopwort Tabelle zusammensetzt 185 6 Teilanwendung 3 HSSS AccessTools myHSSS Aufgrund seines Aufwands sollte dieser Ansatz nur im Notfall verfolgt werden Der zweite Ansatz ist f r den HSSS leider nicht umsetzbar da die zus tzlich lizenzierba re integrierte Volltextsuchmaschine in der Landeslizenz f r Sybase nicht enthalten ist Weitere Ausbaustufen die ber den Status eines Prototypen hinausgehen sollten diese M glichkeit in Betracht ziehen und die F higkeiten und m glichen Vorteile einer inte grierten Volltextsuche genau eruieren Die gegenw rtige Version des HSSS verwendet stattdessen eine externe Volltextsuchmaschine Hier konnte mit dem Java basierten Open Source Produkt Lucene siehe auch Abschnitt D eine Komponente gefunden werden die sich relativ nahtlos in das bestehende Gesamtsystem integrieren lie und einige sehr positive Eigenschaften bietet Der folgende Abschnitt besch ftigt sich etwas n her mit dieser Volltextsuchmaschine 6 2 1 Die Volltextsuchmaschine Lucene Bei Lucene handelt es sich um eine in Java geschriebene Open Source Volltext suchmaschine die durch ihr sauberes Design und die gute Integrationsf higkeit be sticht Sie erm glicht die wichtigsten Suchm glichkeiten wie etwa boolische Suche exakte Suche phrase queries und Fe
344. tadataGeneratorJSPCommunicator als Attribut hinzu 4 Dieses Objekt enth lt bereits Informationen die sich zum Beispiel aus der Konfigurationsstruktur osssdata xml ergeben Anschlie end bergibt der Controller die Kontrolle an das entsprechende JSP der View 5 in diesem Fall an jenes welches das Formu lar mit den unterst tzten Dokumentenarten pr sentieren kann Dieses JSP erstellt dann die dynamische HTML Benutzerschnittstelle unter Nutzung von Informationen des MetadataGeneratorJSPCommunicator Objektes 6 Der Autor w hlt nun die gew nschte Dokumentenart z Bsp Dissertation 7 dieser Parameter wird an den Controller weitergeleitet 8 welcher daraufhin eine entsprechende Objektstruktur initialisiert und die jeweilige Konfigurationsstruktur ein liest z Bsp MetadataSetDissertation xml 9 Die neuen Informationen wer den im MetadataGeneratorJSPCommunicator aktualisiert welcher als Attribut der Session generell verf gbar ist 10 Anschlie end wird die Anfrage an ein ad qua tes JSP weitergeleitet 11 welches wieder mit Hilfe des MetadataGeneratorJSP Communicator Objektes den n chsten Teil der Benutzeroberfl che aufbaut 12 Die folgenden 6 Aktionen werden in dieser Reihenfolge mehrfach hintereinander ausge f hrt was im Sequenzdiagramm durch n symbolisiert ist Der Autor erstellt jeweils ein Teil des Metadatensatzes 13 dieser Teil wird in Form von HTTP Parametern an den Controller weitergeleitet
345. taset text der XML basierte Metadatensatz ak tueller Stand metadatasetcopy text das XML basierte Metadatensatz Original des Autors unique processingid Tabelle A63 die Tabelle temp_metadatasets temp_metadatasets_finished Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV v y eindeutige Identifikationsnummer f r die Tabelle processingid char 100 Y eindeutige Bearbeitungsnummer des Metadatensatzes kindofdocument varchar 30 y Dokumentenart Dissertation Bericht creationdate datetime y Eingangsdatum des Metadatensatzes lastprocessingdate datetime y Datum der letzten Bearbeitung state varchar 30 J Gesamtzustand des Metadatensatzes lastprocessor varchar 100 y letzter Bearbeiter metadataset text der XML basierte Metadatensatz ak tueller Stand metadatasetcopy text der XML basierte Metadatensatz Stand des letzten Einstellens unique processingid Tabelle A64 die Tabelle stat_metadatasets_ finished 266 C 2 Schema pers_address Name DATENTYP I P M BESCHREIBUNG id numeric 6 vV v y eindeutige Identifikationsnummer f r die Tabelle place varchar 100 y Ort code varchar 50 Postleitzahl street varchar 100 Stra e streetnumber numeric 4 Hausnummer country varchar 100 Land unique code country place street streetnumber Tabelle A65 die Tabelle pers_address
346. te der SLUB integriert werden aber auch externe Inhalte Bestimmte Teile der Anwendung ein ausblenden Suchergebnisse bis zum n chsten Besuch per sistent speichern bei neu hinzukommenden Daten im Interessengebiet des Nutzers an diesen automatisch eine E Mail mit dem Link zu der Ressource senden usw 87 3 Systemarchitektur M glichkeit der persistenten Registrierung und die Realisierung aller sinnvollen dadurch m glich werdenden Dienste die zu einer Personalisierung des Angebots f hren 3 2 2 Vorgehensweise Priorisierung Dieser Abschnitt soll die eben beschriebenen Architekturvisionen hinsichtlich ihrer Realisierbarkeit im Rahmen des Diploms und ihrer Kosten Nutzen Relation analysie ren Ziel ist die Zuordnung von Priorit ten und damit die Definition einer Reihenfolge in der die einzelnen Ziele gegebenenfalls anzugehen sind Dabei ist zu beachten dass alle Architekturvisionen grunds tzlich sinnvoll sind aber aus Kosten Zeitgr nden eine Auswahl vordergr ndig zu realisierender Aspekte getroffen werden muss Alle Vi sionen die w hrend des Diploms nicht ber cksichtigt werden k nnen sollten in einer n chsten Ausbaustufe des HSSS wieder in Betracht gezogen werden Die erste Architekturvision die eine XML basierte Struktur f r alle tempor r per sistenten Metadatens tze verlangt ist mit relativ wenig Aufwand realisierbar und deshalb bereits im Rahmen der Diplomarbeit zu unterst tzen Dazu ist das Java Stan da
347. tek turvisionen siehe 3 2 1 ab Seite 80 genannten Anforderungen Abbildung 31 zeigt das Klassendiagramm des Packages metadatagenerator Strukturell gleicht es den Packages der anderen Teilanwendungen so dass es an dieser Stelle exemplarisch eben falls fiir die beiden noch verbleibenden Teilanwendungen AdminTools und Access Tools und deren Packages admintools und accesstools behandelt wird HttpServiet MetadataGeneratorServlet RequestResponseManager SessionManager MetadataGeneratorRequestResponseManager MetadataGeneratorSessionManager MetadataGeneratorRequestResponseManager servlet Met handle reg HttpServietRequest res HttpServletResponse testSession req HttpServietRequest boolean redirect msg String destination String req HttpServietRequd dispatch reg HitpServletRequest res HttpServietResponse init config ServietContig void doGet req HttpServietRequest re doPost req HttpServietRequest re validSession req HttpServietRequest boolean getSessionAttribute name String Object setSessionAttribute name String o Object void invalidateSession void dolt req HttpServietRequest res scanRequestParameters req HttpServietRequest Map generateErrorMessage errorParameters Map void session HipSession updateConfiguration configurationParameters Map void setNextUSPPage void setUSPCommunicator newone boolean alternative boolean Configuration MetadataGener
348. tensatz SWD Schlagwortel 235 Tabelle A16 HSSS Metadatensatz Beschreibung deutsch 235 Tabelle A17 HSSS Metadatensatz Beschreibung englisch 235 Tabelle A18 HSSS Metadatensatz Name der Universit tsbibliothek 236 Tabelle A19 HSSS Metadatensatz Adresse der Universit tsbibliothek 236 Tabelle A20 HSSS Metadatensatz Name der universit ren Einrichtung 237 237 Tabelle A23 HSSS Metadatensatz Gutachter 237 Tabelle A24 HSSS Metadatensatz Betreuer 238 Tabelle A26 HSSS Metadatensatz Tag der m ndlichen Pr fung 238 Tabelle A27 HS55 Metadatensatz Tag der Abgabe Tabelle A28 HSSS Metadatensatz Tag der Abgabe SLUB 239 Ter 239 Tabelle A30 H555 Metadatensatz stabile Dokument URL 239 Tabelle A31 HSSS Metadatensatz reale Dokument URL 240 Tabelle A32 HSSS Metadatensatz HSSS Formatl 240 EE 240 ob en 241 Tabelle A35 HSSS Metadatensatz Ver ftentlichungs Titell 241 Tabelle A36 HSSS Metadatensatz Verdffentlichungs ISBN 241 Tabelle A37 HSSS Metadatensatz Sprache des Dokuments 242 Tabelle A38 HSSS Metadatensatz Literaturquellen extern 242 Tabelle A39 HSSS Metadatensatz Literaturquellen intern 242 En 243 ES 244 Tabelle A42 HSSS Metadatensatz Eingangsdatum 244 Tabelle A43 H Metadatens
349. ter 170 5 3 Persistenzrealisierung in einer SQL Anfrage immer nur bestimmte Parameter ndern die zum Beispiel in nerhalb einer Schleife eingesetzt werden k nnen Die dritte M glichkeit verwendet ein CallableStatement um eine gespeicherte Prozedur innerhalb der Datenbank anzu sprechen wobei bestimmte hnlichkeiten zum zweiten Ansatz bestehen Auch hier werden bestimmte Platzhalter innerhalb der Anfrage durch Parameter ersetzt aller dings ist diese Prozedur auch ber die Lebensdauer der Anwendung hinaus innerhalb der Datenbank gespeichert ist daher immer optimiert und bietet dar berhinaus noch einige weitere Vorteile Die Persistenzrealisierung des HSSS nutzt in erster Linie ge speicherte Prozeduren da diese neben der Tatsache dass sie die performanteste Art darstellen SQL Anweisungen auszuf hren auch den Vorteil bieten mehrere Anwei sungen zusammenzufassen Dies bietet sich insbesondere dann an wenn eine An weisung von den Ergebnissen einer vorangegangenen Anweisung abh ngig ist Dieses Problem tritt zum Beispiel bei dem Einstellen der Metadatens tze in die persistente Datenbasis auf Listing 9 zeigt beispielhaft eine der gespeicherten Prozeduren die zu diesem Zweck innerhalb der Datenbank angelegt wurden und von der Anwendung ber die JDBC Schnittstelle angesprochen werden 1 create procedure insert _type kindofdocument varchar 100 type_name varchar 100 2 type id numeric 4 output as 3 begin 4
350. teren hat die Bearbeitungsnummer im Zusammenhang mit einer zus tzlichen Anwendung f r den Autor eine besondere Funktion die in Abschnitt 125 4 Teilanwendung 1 MetadatenGenerator mitgeteilt wird Die bisher nur vage mit Objektstruktur beschriebene Repr sentati on des Metadatensatzes soll im Folgenden anhand der Abbildung 33 n her erl utert werden XMLNode interface MetadataSet MetadataSetFactory a CT MetadataSetAbstract 1 MetadataSetDissertation interface MetadataSetData __ DissertationMetadataSetData XMLNode interface DC Contributor interface 1 DC ContributorDissertation HsssSubElements 1 DC ContributorGeneric A interface MetadataValidator PE S Pl _ e e MetadataValidatorDissertation 1 MetadataValidatorGeneric N _ Validationinformation MetadataValidatorBericht Abbildung 33 HSSS Package metadataset Ausschnitt Die Abbildung zeigt einen Ausschnitt aus dem Klassendiagramm des Packages metadatset Die allgemeinste Beschreibung eines Metadatensatzes existiert mit der Schnittstelle MetadatSet welche die Grundfunktionalit t der Metadatens tze al ler Dokumentenarten bestimmt Diese Schnittstelle wird zun chst von der Klasse MetadataSetAbstract implementiert von welcher sich die Klassen MetadataSet Dissertation und MetadataSetBericht f r die beiden zur Zeit vom HSSS unter st tzten Dokumentenarten Dissertatio
351. tigten Nutzern mit Administrationsprivilegien mit gro er Vorsicht ge ndert werden da sich hier weite Teile des Gesamtsystems beeinflussen lassen und eine korrupte Konfigurationsstruktur unter Umst nden das gesamte System vor bergehend unbenutzbar macht In diesem Fall muss die betroffene Konfigurationsstruktur repariert oder durch eine Sicherung er setzt werden Bei richtigem Gebrauch kommen allerdings die Vorteile der Architektur an dieser Stelle voll zum Tragen da weite Teile der Anwendung und deren Verhalten ge ndert werden k nnen ohne eine einzige Zeile Quellcode zu ndern Nat rlich w re eine Pr sentation der jeweiligen Konfigurationsstruktur innerhalb eines Formulars ein n chster Schritt in Richtung Nutzerfreundlichkeit und Transparenz da er die XML Strukturen verstecken w rde Eine solche Funktionalit t konnte aber aufgrund des hohen Aufwands im Rahmen der Diplomarbeit nicht realisiert werden und bleibt einer sp teren Ausbaustufe des HSSS vorbehalten _eunsoie Benszenemetung vm Svieshests moer SQL Tooo HSSS AdminTools Al lt xml version 1 0 encoding 150 8859 1 gt lt DOCTYPE HsssData HSSSDATA PUBLIC DTD des H3535 2001 http hsss slub dresden de hsss xml hsssdata dtd gt lt Allgemeine Konfigurationsdaten HSSS Server unterst tzte Sprachen Formate Dokumentenarten etc bertragungsmodi Dokumenten Verzeichnisse etc adsfadsfadsfadsfsdafsadfadst gt lt HsssData HSSSDATA x
352. tinformation _ddb system optional 1 1 5 100 Tabelle A49 HSSS Metadatensatz Exportinformation DDB 246 A 3 Spezifikation der tempor ren Metadaten Bezeichnung EXPORTINFORMATION SWB Beschreibung Informationen zum Metadatenexport an die SWB DC Bezeichnung keine Parametername temp_ exportinformation_ swb Metadatentyp system Regulation optional H ufigkeit 1 1 L ngenrestriktion 5 100 Tabelle A50 HSSS Metadatensatz Exportinformation SWB Bezeichnung DOKUMENTINFORMATIONEN Beschreibung Informationen zum Dokument z Bsp relativer tempor rer Pfad DC Bezeichnung keine Parametername temp _documentinformation Metadatentyp system Regulation mandatory H ufigkeit 1 1 L ngenrestriktion 5 100 Tabelle A51 HSSS Metadatensatz Dokumentinformationen Bezeichnung E MAIL ADRESSE DES AUTORS Beschreibung E Mail Adresse des Autors DC Bezeichnung keine Parametername temp author email Metadatentyp primary Regulation optional H ufigkeit 1 1 L ngenrestriktion 5 100 Tabelle A52 HSSS Metadatensatz E Mail Adresse des Autors 247 A Metadatens tze des HSSS Bezeichnung TELEFONNUMMER DES AUTORS Beschreibung Telefonnummer des Autors DC Bezeichnung keine Parametername temp author telefon Metadatentyp primary Regulation optional H ufigkeit 1 1 L ngenrestriktion 5 100 Tabelle A53 HSSS Metadatensatz Telefonnummer des Autors Beze
353. tion von Software in Form von Problem L sungs Paaren beschreiben und an andere Entwickler weiter geben Au erdem erleichtern Muster die Beschreibung komplexer Systeme erheblich weil sich in ihnen bestimmte Struk turen zusammenfassen und benennen lassen In der Regel werden Muster zus tzlich in verschiedene Kategorien eingeordnet die den Abstraktionsgrad des Musters wieder spiegeln z Bsp Architekturmuster Entwurfsmuster Paradigmen etc Zu diesem Thema sind im Verlauf der letzten Jahre eine Reihe von Publikationen erschienen auf die an dieser Stelle verwiesen werden soll GHJ96 Gra98 BMR98 Dieser Abschnitt befasst sich mit Entwurfsmustern und stellt beispielhaft zwei sol che Muster vor die in dem Gesamtsystem relativ h ufig Verwendung fanden Es handelt sich um die Muster Singleton und Fabrikmethode die an verschiedenen Stel len der Gesamtanwendung immer wieder eingesetzt wurden Die folgende Auflistung enth lt jeweils eine kurze Definition des Musters nach bzw Gra98 die folgenden Abbildungen zeigen jeweils ein formales Klassendiagramm fiir die Muster e Singleton Es wird abgesichert dass eine Klasse genau ein Exemplar besitzt und es wird ein globaler Zugriffspunkt bereitgestellt e Fabrikmethode Es wird eine Klasse mit einer Operation zur Erzeugung von Objekten in Ab h ngigkeit eines bestimmten Diskriminators realisiert Andere Klassen k nnen die Erzeugung von solchen Objekten komplett an die Fabrikklasse de
354. tisch weil das Auffinden der gespeicherten Feldinformationen pro Dokument im Index eine teure Operation ist welche die Antwortzeit auf die Suchanfrage signifikant erh ht Au erdem ist die entstehende Datenstruktur welche diese Feldinformationen der Do kumente enth lt um ein Vielfaches gr er als das originale Hits Objekt Will der Nutzer nun auch noch nur einen Bruchteil des Gesamtergebnisses wirklich sehen sind die Aufw nde f r alle ignorierten Dokumente umsonst unternommen worden Deshalb bietet sich ein differenziertes Vorgehen an wie es durch die Methode getPageSet realisiert wird Der Klasse HsssHitCollector sind die augenblicklich aktuellen Werte f r start Zeiger auf den ersten Treffer der Teilmenge und count Gr e der Teilmenge be kannt Als erstes wird durch den Aufruf der Methode isPageCached herausgefunden ob es sich bei der aktuell geforderten Teilmenge um eine Teilmenge handelt die schon einmal geliefert wurde und die sich in diesem Fall in der Datenstruktur results Ca che befinden w rde Ist dies der Fall brauchen nur noch die entsprechenden Objekte des Typs Hit in die zur ckzuliefernde Ergebnismenge kopiert zu werden start zeigt auf den jeweils ersten Treffer der Teilmenge count gibt die aktuell gew hlte Gr e der Teilmenge an results fungiert quasi als Cache f r schon gezeigte Teilmengen deren Dokumenteninformationen vollst ndig vorhanden sind SortedMap 24 194 6 2 Objektori
355. ts angedeutet 39dazu k nnte der gezeigte View Komponenten Ansatz erweitert und ausgebaut werden 207 7 Implementierung des OAI Protokolls Inhalt des Kapitels 7 1 Objektorientierte Analyse und Design 7 2 Re lisier ng pce se 0 20 82 0 a ei D nen ee 1 3 Binsch tzung sonses 3 22 2 AA 209 7 Implementierung des OAI Protokolls In diesem Kapitel soll die Implementierung des OAI Protokolls und deren Entwurf f r den HSSS erl utert werden Da auf das OAI Protokoll bereits in Abschnitt auf Seite 40 cingegangen wurde und mit eine detaillierte Protokollspezifikation existiert kann dieses Kapitel relativ kurz gefasst werden und dabei vor allem die Besonderheiten der Implementierung fokussieren 7 1 Objektorientierte Analyse und Design Alle OAI spezifischen Klassen wurden in dem separaten Package hsss oai zusam mengefasst Abbildung 62 zeigt die Klassen dieses Packages in einem Klassendia gramm OAlMetadataSet OAlMetadataRetriever dbman DBManager null HttpServlet OAlServlet init config ServletConfig void doGet req HitpServletRequest reg doPost req HttpServietRequest re dolt req HttpServletRequest res 0AlMetadataSet createNode mf MetadataFormat OAlMetadataRetriever man DBMa isMetadataSetAvailable identifier S getMetadataSet identifier String O getldentifiers from String until String produceldentifyResult req HttpSe produceListSetsResult
356. tsystem erfordern einen hohen Zeitaufwand und ein sauberes Gesamtdesign Auch die Teilanwendung AdminTools wurde intensiv getestet und hat sich bei der Einstellung vieler Hochschulschriften bereits bew hrt Dabei konnten auch die spezifizierten Arbeitsabl ufe vollst ndig und erfolgreich begleitet werden Technische Schwierigkeiten gab es zum Teil bei dem Export der Metadaten an externe Institutio nen diese konnten jedoch im weiteren Verlauf relativ schnell behoben werden Diese erwarteten Schwierigkeiten beim Verlassen der Systemgrenzen bestanden vor allem in der Anpassung der Zeichens tze sowie bestimmter Kommunikationsparameter Zum Teil waren die Exportanforderungen der Institutionen nicht exakt genug so dass n derungen im Nachhinein durchgef hrt werden mussten die aufgrund der verwendeten Technologie XML und XSL in den meisten F llen jedoch im Minuten Bereich lagen und kein Neukompilieren von Anwendungsteilen oder gar ein Neustart des Systems verlangten Ein weiteres Problemfeld besteht in der automatisierten Textextraktion aus PDF welches bei bestimmten Dokumenten nicht zufriedenstellend m glich war Da offizielle Produkte von Adobe aber auch keine besseren Ergebnisse zeigten schei nen diese Probleme genereller Art zu sein und sollten im Vorfeld durch entsprechend sorgf ltiges Konvertieren vermieden werden In diesem Bereich m ssen aber auch noch Erfahrungen durch die Praxis bzw im Austausch mit anderen Universit tsbibliotheken
357. ttp hsss slub dresden de hsss servlet hsss urlmapping MappingServlet 7id 993471 154921 2399 v wechseln zu Links gt HSSS N TECHNISCHE LI UNIVERSITAT DRESDEN HochschulSchriftenServer der SLUB Dresden Eingang zum Volltext Hinweis zum Urheberrecht Peter Fibich Gedenkst tten Mahnmale und Ehrenfriedh fe f r die Verfolgten des Nationalsozialismus Dissertation im pdf Format Kurzfassung Die Dissertation untersucht die in Deutschland zwischen 1945 und 1960 entstandenen Denkmalanlagen f r NS Verfolgte unter dem Aspekt ihrer landschaftsarchitektonischen Gestaltung Dabei stehen die Zusammenh nge zwischen der Freiraumgestalt und dem jeweiligen gesellschaftspolitischen Umfeld im Zentrum Die Untersuchung ist als vergleichende Geschichtsbetrachtung zwischen den Besatzungszonen bzw den deutschen Staaten angelegt Die verschiedenen gesellschaftlichen Strukturen und ideologischen Ausrichtungen beider Systeme haben sich intensiv auf Inhalt Gestalt Lage und Quantit t der Denkmalanlagen ausgewirkt W hrend in der BRD spezielle Anlagen f r NS Verfolgte quantitativ zugunsten bergreifender Denkm ler f r alle Opfer des Krieges und der Gewaltherrschaft zur cktraten fand in der DDR eine Einschr nkung auf die Angeh rigen des kommunistischen Widerstandskampfes statt In einer vor bzw au erstaatlichen Phase die bis zu Beginn der f nfziger Jahre andauerte dominierten die Alliierten und die berlebenden der NS V
358. tuttgart OPUS http elib uni stuttgart de opus 291 Literaturverzeichnis L OR L SC L SH L SO L ST L SW L SY LTE L XL L XLa Oracle8i Database Server http www oracle com ip index html content html XML Schema http www w3 org XML Schema SELFHTML http www teamone de selfhtml selfhtml htm Simple Object Access Protocol SOAP http www w3 org TR SOAP Struts Framework http jakarta apache org struts index html Serverwatch http serverwatch internet com halloffame html Sybase Adaptive Server Enterprise ASE http www sybase com products databaseservers ase Tomcat http jakarta apache org tomcat XML http www w3 org XML XSL and XSLT http www w3 org Style XSL 292
359. tyName String SS ne 9 description List HsssException msg String department Institution faculty Institution institute Institution solution String causeFile String causeParameter Set Abbildung 23 HSSS Package utilities Ausschnitt Die Klassen HsssException und HsssError stehen beispielhaft fiir die ebenfalls in diesem Package zahlreich vorhandenen System Hilfs und Werkzeugklassen So wird HsssError von den Teilanwendungen dafiir verwendet aufgetretene Ausnahmen und Laufzeitfehler zu beschreiben und dem System sowie den Anwendern zur Ver f gung zu stellen Zu den Beschreibungsm glichkeiten dieser Klasse geh ren Fehler Identifikationsnummer Kurzbeschreibung detaillierte Fehlerbeschreibung L sungs m glichkeiten sowie Angabe der JSP Datei bzw der Parameter die bei der Ent stehung des Fehlers beteiligt waren Die Klasse erlaubt somit die Generierung von verst ndlichen und ausf hrlichen R ckmeldungen an die Nutzer des Systems Daneben enth lt utilities weitere Packages auf der n chsten Seite zeigt Ab bildung 24 als Beispiel das Package xml welches alle f r die Gesamtanwendung re levanten Klassen kapselt die sich im weitesten Sinne mit XML auseinandersetzen F r fast alle Bearbeitungsschritte im Zusammenhang mit XML wird das API JDOM 45 JDOM ist eine Bibliothek die als Aufsatz auf verschiedene XML Parser SAX DOM fungiert und dabei eine auf die Sprache Java optimierte Schn
360. typische Merkmale und Struktur Da OAI Antworten XML Daten enthal ten wie am Beispiel der Record Struktur zu sehen war muss der HTTP Header Content Type auf text xml gesetzt werden Listing 2 zeigt den schematischen Auf bau einer OAI Protokoll Antwort HTTP 1 0 200 OK Content Type text xml lt xml version 1 0 encoding UTF 8 gt lt GetRecord xmlns http www openarchives org OAI 1 0 OAI_GetRecord xmlns xsi http www w3 org 2000 10 XMLSchema instance 9 xsi schemaLocation http www openarchives org OAI 1 0 OAI GetRecord 10 http www openarchives org OAI 1 0 OAI_GetRecord xsd gt 11 lt responseDate gt 2001 05 01T19 20 30 04 00 lt responseDate gt 12 lt requestURL gt http hsss slub dresden de hsss servlet hsss oai OAIServlet verb GetRecord 13 gzamp identifier 0ai 3hsss 3A99010018976 5678 14 amp amp metadataPrefix oai_dc lt requestURL gt 15 lt content of record gt 16 lt GetRecord gt DD 4 CD E ob MH Listing 2 Struktur einer OAI Protokoll Antwort Eine Reihe von OAI Anfragen liefern Listen von diskreten Elementen Unter Um st nden soll nicht die gesamte Liste auf einmal bertragen werden zum Beispiel ab einer bestimmten Listengr e In diesem Fall bedarf es einer Flusskontrolle durch das Protokoll Im OAI Protokoll kann ein Repository auf eine Anfrage mit einer unvoll st ndigen Teil Liste antworten allerdings nur zusammen mit einem Wiederaufnah mezeiger Resumption
361. tzbestandteile 84 Tabelle 4 Konfigurationsstrukturen des Haal 95 Tabelle 5 die Tabelle temp_metadatasets 134 Tabelle 6 Dokument spezifische Zust nde 147 Tabelle 7 Metadaten spezifische Zust ndel 2 a a 147 Tabelle 8 Gesamtzust nde und Abh ngigkeiten 2 22 2 2 148 Tabelle 9 Bearbeitungsm glichkeiten von Metadatens tzen 153 Tabelle 10 Zuordnung der DC Kategorien zu den Strukturen 170 Tabelle 11 Vor und Nachteile der Abbildungsans tze 180 Tabelle 12 Dokumentenfelder und Inhaltel 192 Tabelle A1 Kriterien f r die Metadatenbeschreibungl 230 Tabelle A2 HSSS Metadatensatz Originaltitel der Documents 231 Tabelle A3 HSSS Metadatensatz Untertitel weitere Titel 231 Tabelle A4 HSSS Metadatensatz bersetzter Tell 232 Tabelle A5 HSSS Metadatensatz Name des Verfassersl 232 Tabelle A6 HSSS Metadatensatz Geburtsdatum des Verfassers 232 Tabelle A7 HSSS Metadatensatz Geburtsort des Verfassers 233 Tabelle A9 HSSS Metadatensatz Adresse des Verfassers 233 Tabelle A10 HSSS Metadatensatz Eigene Schlagworte deutsch 233 Tabellenverzeichnis Tabelle A11 HSSS Metadatensatz Eigene Schlagworte englisch 234 Tabelle A12 HSSS Metadatensatz DNB Klassifikation 234 Tabelle A15 HSSS Metada
362. tzen Diese Erweiterung muss mit den Konfigurationsstrukturen synchronisiert werden Ziel sollte es sein zu mindest Englisch durchgehend als alternative Sprache in den Benutzerober fl chen etc zu unterst tzen Besonders wichtig w re diese Unterst tzung f r die Teilanwendungen MetadatenGenerator und AccessTools myHSSS 223 8 Zusammenfassung und Ausblick e Die in Abschnitt vorgestellte Java WebStart Technologie kann dazu f hren dass die Vorteile von Web Anwendungen leichtes Deployment gute Wartbar keit und die von traditionellen clientseitigen Anwendungen reichhaltige Benut zerschnittstelle vertraute Umgebung zusammenkommen k nnen Allerdings hat die Realisierung einer WebStart basierten Anwendung keine berragende Prio rit t da bereits funktionst chtige webbasierte Teilanwendungen existieren und eine solche Realisierung niemals ersetzend sondern alternativ angeboten werden sollte Am sinnvollsten w re eine solche Alternative f r die zweite Teilanwendung Admin Tools 8 2 2 Verbesserungsm glichkeiten f r den MetadatenGenerator Die Mehrheit der hier aufgef hrten Verbesserungen bzw Erweiterungen wurde bereits in Abschnitt auf Seite diskutiert der Vollst ndigkeit halber sollen sie hier trotzdem noch einmal aufgef hrt werden e Die Navigation durch die einzelnen Masken des MetadatenGenerators sollte wei ter verbessert werden indem eingegebene Daten auch bei einem Klick auf Zu r ck bern
363. u der in Abschnitt o an Rahmen der URL Abbildung vorgestellten Klasse UrlMapper besitzt Sie wird bei der Initia lisierung der Klasse OAIServlet ebenfalls initialisiert und verf gt ber eine Referenz auf die Datenstruktur in der das OAIServlet die Assoziationen von Wiederaufnah mezeigern und Restmengen verwaltet Die Klasse ResumptionCleaner untersucht periodisch alle Wiederaufnahmezeiger daraufhin ob sie noch aktuell sind Die Ent Da dieser Zufallsgenerator wesentlich schneller ist und die kryptographisch sicheren Zufallszahlen an dieser Stelle nicht unbedingt notwendig sind 8Die Periodendauer kann wieder ber die Konfigurationsdatei web xml eingestellt werden 213 7 Implementierung des OAI Protokolls scheidung ob ein Wiederaufnahmezeiger aktuell ist wird dabei anhand des folgenden Algorithmus getroffen Annahme es sei clean delay ein Wert in Millisekunden der angibt wie alt ein Wie deraufnahmezeiger pro Teilergebnismenge werden darf Annahme es sei hash map die Datenstruktur die die Assoziationen von Wiederauf nahmezeigern und Restmengen enth lt e iteriere ber alle Wiederaufnahmezeiger von hash map f hre jeweils folgende Aktionen aus 1 2 hole den n chsten Wiederaufnahmezeiger aus hash map extrahiere aus dem Wiederaufnahmezeiger den Zeitstempelbereich gt init timestamp extrahiere aus dem Wiederaufnahmezeiger die Anzahl der Teilergebnismen gen gt parts Berechne das Alter des
364. uccess Seite aktualisieren Sollte Ihr Browser diese Seite nicht korrekt anzeigen klicken Sie bitte hier Dokumentenart Dissertation Erstellt am 2001 07 06 Bearbeitet durch Frau B rbel Krause Zuletzt bearbeitet am 2001 07 13 Abbildung 39 SLUB MetadatenGenerator Bearbeitungsstatus Wie die Abbildung zeigt wird dem Autor die gesamte Abfolge der Bearbeitungszu st nde in ihrer zeitlichen Reihenfolge gezeigt Der f r seinen Metadatensatz momentan zutreffende Bearbeitungsstatus wird dabei gesondert hervorgehoben So kann der Au tor die augenblickliche Situation relativ gut einsch tzen Zu den weiteren interessanten Informationen geh ren der Name des Bearbeiters sowie das Datum der letzten Bear beitung Der Vorteil in dieser zus tzlichen Fuktionalit t liegt f r die Mitarbeiter des 138 4 4 Zus tzliche Funktionalit ten Referats 5 3 vor allem darin dass der Autor eine bequeme M glichkeit hat sich ber den Bearbeitungsstatus online zu informieren und damit f r ihn nicht die Notwen digkeit einer direkten Interaktion telefonisch per E Mail besteht was wiederum die Mitarbeiter des Referats 5 3 entlastet 4 4 3 MetadatenGenerator Light eine Alternativ Version Auch wenn mit der bisher vorgestellten Version des MetadatenGenerators alle An forderungen an eine solche Anwendung erf llt werden konnten bleiben einige wenige Benutzer ausgeschlossen n mlich solche die die technischen Vor
365. und Abteilungen sowohl innerhalb als auch au erhalb der SLUB erstreckt Daher musste das Gesch ftsmodell besonders in tensiv mit allen Beteiligten besprochen und auf die jeweiligen Bed rfnisse abgestimmt werden Die entstandenen Arbeitsabl ufe werden getrennt f r jede der zwei derzeit vom HSSS unterst tzten Dokumentenarten vorgestellt Zur Beschreibung wird die Unified Modeling Language UML genutzt die sich als Standardmodellierungssprache inzwi schen weltweit durchgesetzt hat BRJ99 Zur Beschreibung der Arbeitsabl ufe eignen sich dabei vor allem Diagramme die in der Lage sind die dynamischen Aspekte eines Systems zu beschreiben Daher werden f r die Erl uterung des Gesch ftsmodells im Folgenden Anwendungsfalldiagramme und Sequenzdiagramme genutzt Zun chst sol 62 3 1 Gesch ftsmodelle und Arbeitsabl ufe len aber die innerhalb der SLUB beteiligten Referate vorgestellt werden Tabelle 2 z hlt diese auf und erl utert zus tzlich die jeweils wichtigsten Aufgabenbereichd Referat AUFGABENBEREICHE Referat 3 1 Referat f r Monographien und Sonderformen Referat 3 4 Referat f r Pflicht Tausch und Geschenk Dieses Referat beinhaltet die Hoschschulschriftenstelle die den Schriftentausch Druckexemplare mit Ver ffentlichun gen der TU Dresden realisiert sowie die Pflichtabgabestelle welche in Sachsen erschienene Druckerzeugnisse entgegen nimmt z Bsp Berichte Referat 4 1 4 2 Referat f r Formalerschli
366. ung dieser Klasse an die Factory delegieren so dass sie selbst nichts von der Instanziierungs entscheidung wissen muss sondern lediglich die Schnittstelle Product kennt Selbst wenn sie Kenntnis ber das konkrete Produkt besitzt sollte sie trotzdem nur die Produkt Schnittstelle nutzen und ihr Wissen lediglich in Form eines Diskriminators an die Fabrikmethode der Factory Instanz weitergeben Der Einsatz dieses Musters entkoppelt also verschiedene Bereiche von Anwendungen indem spezielles Wissen in bestimmten Klassen zusammengefasst werden was wiederum den Vorteil hat das sich nderungen bzw Erweiterungen auch nur auf diese Klassen auswirken Abbildung 27 auf der folgenden Seite zeigt einen Ausschnitt aus dem Packa ge temporalpersistence der Gesamtanwendung in dem die beiden beschriebenen 106 3 3 Architekturdetails Muster enthalten sind Die Klasse TemporalStorageFactory ist dabei sowohl Single ton als auch Fabrik und kann ber die Methode getInstance erreicht werden und ber die Methode createTemporalStorage in Abh ngigkeit von Konfigurationspa rametern in der Konfigurationsdatei web xml Instanzen vom Typ TemporalStorage erstellen Bei diesen Instanzen handelt es sich um Klassen die die Schnittstelle TemporalStorage entweder dateibasiert FileTemporalStorage oder datenbankba siert SybaseDBTemporalStorage implementieren Singleton nur eine Instanz ber getinstance und gleichzeitig Factory Mit F
367. verwendet beim Einstellen der Metadaten liefert id der universit ren Einrichtung und erstellt sie gegebenenfalls wird verwendet beim Einstellen der Metadaten liefert id der rechtlichen Bedingungen und erstellt sie gegebenenfalls wird verwendet beim Einstellen der Metadaten liefert id des Datums und erstellt es gegebenenfalls wird verwendet beim Einstellen der Metadaten liefert id der Person und erstellt sie gegebenenfalls wird verwendet beim Einstellen der Metadaten liefert id des der Schlagworts Klassifikation und erstellt es sie gegebenen falls wird verwendet beim Einstellen der Metadaten Titels und erstellt ihn wird verwendet beim Einstellen der Metadaten Formats und erstellt es gegebenenfalls liefert id des liefert id des wird verwendet beim Einstellen der Metadaten liefert id der Literaturquelle und erstellt sie gegebenenfalls wird verwendet beim Einstellen der Metadaten liefert id der Ver ffentlichung und erstellt ihn gegebenenfalls wird verwendet beim Einstellen der Metadaten erstellt neuen Metadatensatz mit allen ben tigten Fremdschl sseln l scht einen Metadatensatz mit allen zugeh rigen Beschrei bungen und Titeln iefert das gr te id Attribut der Tabelle pers_metadatasets liefert alle Tupel absolute URL relative URL ab einem be stimmten Wert f r id liefert alle id s und absoluten URL s f r die Indexerstellung liefert den Volltext f r die Indexerstellung
368. wender kein Installationspro zess notwendig ist e Der JNLP Client kann die Ressourcen im lokalen Cache mit denen auf dem Server vergleichen und somit entscheiden ob neuere Programmteile nachgeladen werden m ssen Eine solche Aktualisierung ist f r den Anwender transparent e Dieser Mechanismus erlaubt eine sehr feine Teilung von Anwendungen in einzelne Ressourcenteile So ist es m glich die Aktualisierung inkrementell vorzunehmen und zum Beispiel nur einzelne Klassen nachzuladen was zu einer erheblichen Reduzierung der Downloadzeit f hrt e Das JNLP Protokoll erm glicht ebenfalls eine inkrementelle Installation so dass Programmteile die vorerst nicht ben tigt werden auf dem Server verbleiben Sie k nnen im sp ter in Form einer inkrementellen Aktualisierung nachgeladen werden Die Java WebStart Technologie bzw das JNLP Protokoll erm glicht dabei f r sol che Anwendungen Sicherheitsmerkmale wie sie von der Java 2 Plattform bzw von 112 3 3 Architekturdetails Applets bekannt sind also insbesondere den Ablauf in geschiitzten Bereicher Sand boxing Damit k nnte sich JNLP und die WebStart Technologie zu einem wichtigen Baustein in der Java 2 Plattform entwickeln der die Br cke zwischen laufendem Be triebssystem und Web zentrierten Java Anwendungen schl gt Allerdings besteht die Voraussetzung dass sich ein solcher JNLP Client z Bsp WebStart lokal auf dem Rechner befindet Ideal w re demnach die Integrat
369. wobei zu n chst wieder Besonderheiten der Teilanwendung in Bezug auf deren Design bzw deren Architektur betrachtet werden Anschlie end wird die Realisierung dieser sehr umfangreichen Anwendung detailliert beschrieben wobei die beiden Funktionsbereiche Arbeitsablaufunterst tzung und Administrationsunterst tzung unterschieden werden Danach wird im Rahmen der Persistenzrealisierung dieser Teilanwendung der wesent liche Teil des Datenbank Schemas uns dessen Design beschrieben Am Ende erfolgt wieder eine Einsch tzung der Implementation sowie ein Ausblick auf m gliche Verbes serungen bzw Erweiterungen Im dem sich anschlie enden Kapitel wird die dritte Teilanwendung betrachtet welche den Web basierten Zugriff auf die im Gesamtsystem vorhandenen Hochschul schriften bzw deren Metadaten realisieren soll Zun chst wird jedoch eine Indirektion betrachtet die es erlaubt stabile URL s zu garantieren Diese sind eine wichtige Voraussetzung f r die langfristige Verf gbarkeit der Hochschulschriften Anschlie end wird das Design der dritten Teilanwendung n her erl utert wobei der Fokus insbeson dere auf der Beschreibung und der Integration einer externen Volltextsuchmaschine liegt Danach wird die entstandene Realisierung vor allem im Bezug zu den f r diese Teilanwendung aufgestellten Architekturvisionen betrachtet bevor wieder eine Ein sch tzung der Ergebnisse das Kapitel abschlie t Danach erfolgt eine Frl uterung der Implementatio
370. wunderlich dass zum jetzigen Zeitpunkt nach fast einem Jahr erst etwa vier bis f nf Archive mit OAI Protokoll Implementierung existieren Von einer breiten Durch setzung dieses Protokolls kann also keine Rede sein Wie lie en sich diese M ngel beheben Folgende Punkte k nnten nach Einsch tzung des Autors zu einer Besserung der Situation f hren e Als erste Voraussetzung muss sich der Bund genauer das Bundesforschungsmi nisterium entscheiden wie wissenschaftliche Publikationen rechtlich und poli tisch gehandhabt werden Nach der berzeugung des Autors kann die Entschei dung nur lauten Wissenschaftliche Publikationen sind im wesentlichen durch Steuergelder finanzierte immaterielle Werte Aus diesem Grund sind sie Public Domain m ssen also der gesamten ffentlichkeit und insbesondere der Wissen schaft selbst ohne gr ere Zusatzkosten zug nglich sein e Als logische Konsequenz daraus folgt zwingend dass das Bundesforschungsmi nisterium eine Organisation ins Leben rufen muss welche die folgenden Anfor derungen durchsetzen kann und mit entsprechenden Legitimationen ausgestattet ist Diese Organisation muss zum Ziel haben die nationale Infrastruktur im Bereich digitaler wissenschaftlicher Publikationen und e print Services so aus zubauen dass diese Dienste f r wissenschaftliche Einrichtungen zum Selbstkos tenpreis verf gbar sind Zu diesem Zweck tritt die Organisation mit Legitima tionen auf die es ihr erlau
371. y a ae en ea AN 227 229 Ka 230 EE 231 be hth e utah Se AA AA OS eS 231 O E 232 of Bee A a as ts a 233 KC Ee e re a 235 EE 236 A IAE 237 eg a 238 a a ci Pe ds Sende Sei ie 239 EE EC RE a ee 239 o er EE ar BAe Bo a ad BAe 240 A 2 11 DC SOURCH 2 ga 4 2a we hb Kuna ar EEE EG EES 241 242 242 243 244 249 B 1 berblick naa a oy oe a he eae Fe ba ae ae ae eee ae ae 250 BZ web xml o 242 44 464646 46466 664 64 66444 6464 A i 251 Poe hsssda ta xml i fot ES Sd E CE a Der de 253 Inhaltsverzeichnis B 4 MetadataSetDissertation xml MetadataSetBericht xml 255 B 5 oaisets xml est 362 Ys Bare ee Bee eB we ee ee Ae ee 257 259 C 1 berblick 240 ee Boe ee be ewe eee GL ame bee wes 260 a a ae ee ee ee ee eh ee ee 265 275 AS 276 AAA 276 oo oa ais 277 eee EC EE EE at O SE St 277 EEE ER ER EEE RER 277 REI 278 e na Be Ie ra a ie eS 278 cdas o a A a ee ee 279 oe he a ee Be ae EE 279 bs ae ee aa ie Oh ee tg a ree ee ie er Oy See e See ee ae 280 Sg ee pln ee lene epee SG plan See 280 i et Ae ea He ek we a He a 281 Abbildungsverzeichnis gt S Gesamtanwendung 31 Abbildung 2 Anwendungsfalldiagramm Kontext des Systems f r den Autor 64 Abbildung 3 Sequenzdiagramm Gesch ftsgang in Bezug auf den Autor 65 Abbildung 5 Sequenzdiagramm sesch ftsgang in Bezug auf das Referat 5 3 Teil 67 Abbildung 6 Sequenzdiagramm
372. zugegriffen werden Die folgende Aufz hlung fasst noch einmal grob zusammen welches die wichtigsten Schritte sind um mit Lucene zu interagie ren 1 Erstellen eines Index a Erstellen von Objekten des Typs Document b Hinzufiigen von Feldern Field c Erstellen eines IndexWriter Objekts und Hinzuf gen der Dokumente durch addDocument 2 Erstellen der Suchanfrage und bermittlung an Lucene a Aufrufen von QueryParser parse liefert ein Query Objekt b Erstellen einer IndexSearcher Instanz c Aufrufen der search Methode des IndexSearcher liefert ein Ergebnis vom Typ Hits 3 Auswerten des Ergebnisses a Zugriff auf die einzelnen Treffer mit score int i Rang des i ten Treffers bzw doc int i Dokumenteninformationen des i ten Treffers 18dabei wird der Fall angenommen dass auch noch ein Index neu zu erstellen ist 190 6 2 Objektorientierte Analyse und Design 6 2 2 Integration von Lucene in die Anwendung Die Volltextsuchmaschine Lucene konnte aufgrund ihres sauberen objektorientierten Designs sehr gut in die gesamte Anwendung integriert werden Innerhalb des Packa ges hsss utilities enth lt das Package lucene alle Klassen die den Zugriff auf die Volltextsuchmaschine kapseln Abbildung 55 zeigt das Klassendiagramm dieses Packages Thread LuceneManager String d tmp testindex man DBManager null ms MetadataSet null search fields Strinall title des LuceneManager config

Download Pdf Manuals

image

Related Search

Volltextdokument

Related Contents

取扱説明書 エア波釘打 AJ150  OK etiqueta Romectin 140x140  Iérama  

Copyright © All rights reserved.
Failed to retrieve file