Ingrid Lemberg Homepage
Publikationen
Vorträge

Die Belegbearbeitung in der lexikographischen Datenbank des DEUTSCHEN RECHTSWÖRTERBUCHS

Die Wörterbuchartikel für das Deutsche Rechtswörterbuch (DRW) werden auf einer Basis von rund 8.000 Quellen erstellt. Die Quellentexte liegen zum weitaus größten Teil in Buchform vor, zu einem sehr kleinen, aber hoffentlich immer größer werdenden Teil auch in Form von maschinenlesbaren Texten sowie in Form von elektronischen Faksimiles, d.h. in Bilddateien. Die Wörterbuchartikel werden in der lexikographischen Datenbank des DRW erfaßt, redaktionell überarbeitet und verwaltet. Auf diese Art und Weise entsteht mit der voranschreitenden Produktion des Wörterbuchs auch ein elektronisches Belegarchiv, das, ebenso wie das Zettelarchiv, Benutzern und Benutzerinnen zur Verfügung steht. Im Augenblick kann man die Datenbank nur in Heidelberg selbst benutzen, aber die Überlegungen und Vorbereitungen, die Recherchemöglichkeiten auch online [1] anzubieten, sind im Gang. Zur Zeit [2] ist das DRW mit einer Homepage im Internet präsent, die die Konzeption des Wörterbuchs vorstellt, einen Einblick in seine Geschichte gibt und eine erste Version von Probeartikeln bereithält. Die Adresse lautet:
http://www.uni-heidelberg.de/institute/sonst/adw/drw/

1. Konzeption und Rahmenbedingungen

Das DRW [3] beschreibt den Wortschatz des westgermanisch-deutschen Rechts von den Anfängen seiner schriftlichen Überlieferung im 5./6. Jahrhundert bis in das beginnende 19. Jahrhundert hinein, und zwar des Rechts im weitesten Sinne: nicht nur Fachtermini wie Mord, Notar, Obrigkeit oder Pacht sind Beschreibungsgegenstand des Wörterbuchs, sondern auch alle Wörter, die rechtsbezügliche Fakten, Handlungen oder Gegenstände repräsentieren, also Substantive wie Apfel, Muttersprache oder Ohr, Verben wie machen oder nehmen und Adjektive wie links, nackt oder ohnmächtig. Damit ist das Wörterbuch ein Nachschlagewerk für rechts- und sprachhistorische Verständnisfragen - und es ist darüber hinaus auch eine "Fundgrube kulturgeschichtlichen Wissens" [4].
Die sprachlichen Grundlagen sind schriftliche Quellen zum Frankolateinischen, Langobardischen, Altenglischen, Altfriesischen, Mittelniederländischen und vor allem zu allen Varietäten des Hoch- und Niederdeutschen.
Die Struktur der Wörterbuchartikel [5] ist bestimmt durch einen Artikelkopf, der neben der Lemmaangabe und der Angabe der Wortart gegebenenfalls auch Angaben zur Etymologie, sprachgeographische Angaben sowie Sachhinweise enthält, durch die Gliederung des Bedeutungsspektrums und den Bedeutungserläuterungen, die den sprachlichen und sachlichen Informationsanliegen der Benutzer Rechnung tragen, durch ein explizites und implizites Verweissystem, das eine Vernetzung auf der Ebene der Wortbildung, Onomasiologie und enzyklopädischen Angaben herstellt, sowie einer möglichst reichen Belegdarbietung, in der die diachronische, die diatopische, die diastratische und die situative Differenziertheit der Belege abgebildet wird, und in der den rahmenkennzeichnenden Belegen [6] ein besonderes Gewicht zufällt.
76.476 Wörterbuchartikel von Aachenfahrt bis opferbar sind bisher in neun kompletten Bänden sowie dem ersten Doppelheft des zehnten Bandes [7] gedruckt.

2. Die Computerisierung des Deutschen Rechtswörterbuchs

Die Computerisierung des DRW [8] erfolgte ab der Mitte der achtziger Jahre bei laufender Artikelproduktion, zunächst mit der Anschaffung von Terminals und der Verbindung zum Universitätsrechenzentrum. Darauf folgte eine Phase der Texterstellung mit dem stand-alone-Betrieb von PC's. Seit 1991 schließlich wird das Wörterbuch in einer lexikographischen Datenbank erstellt. Die Programmbasis unserer lexikographischen Datenbank ist ein kommerzielles Dokumentationsprogramm namens FAUST [9], das sich durch nicht standardisierte, extrem flexible Erfassungsmasken, Volltextretrieval- und Indexierungsfunktionen sowie zahlreiche Verknüpfungsmöglichkeiten auszeichnet.
Die lexikographische Datenbank des DRW ist in verschiedene Arbeitsbereiche aufgeteilt - in der Softwaresprache werden diese Bereiche Dokumentationen genannt.

Abb. 1: Dokumentationsauswahl in der lexikographischen Datenbank des DRW

Abb. 1: Dokumentationsauswahl in FAUST


Abbildung 1 zeigt das Arbeitsfenster von FAUST mit der Auswahlmöglichkeit derjenigen Datenbankdokumentationen, die, mit Ausnahme der Dokumentation Adressen, für die Wörterbucharbeit relevant sind:
1. in der Dokumentation Manuskript werden die Wörterbuchartikel erfaßt und bearbeitet,
2. in der Dokumentation Textarchiv sind die maschinenlesbaren Quellentexte untergebracht,
3. die Dokumentation drwartikel dient der Zwischenablage der konventionell gedruckten, maschinenlesbar gemachten Wörterbuchstrecken, die für den Datenbankimport überarbeitet werden müssen,
4. in der drwtitel-Dokumentation werden das Quellencorpus und die Sekundärliteratur nach bibliothekarischen und lexikographischen Gesichtspunkten verwaltet,
5. die von uns faksimilierten, d.h. als Bilddateien abgelegten Quellentexte werden in der Dokumentation Faksimiles verwaltet.
Zwischen den einzelnen Dokumentationen sind vielfältige Verknüpfungen [10] möglich.

Die Erfassung der Wörterbuchartikel erfolgt in der Dokumentation Manuskript, innerhalb derer es für die verschiedenen makro- und mikrostrukturellen Einheiten des Wörterbuchs verschiedene Objektarten, darunter die Objektart Beleg gibt. Für die Bearbeitung der Wörterbuchartikel sind die Objektarten Artikel (für die Erfassung des Artikelkopfes und der Erläuterungsteile) und Beleg wesentlich.

Abb. 2: Auswahlmenü der Objektarten in der Dokumentation Manuskript

Abb. 2: Auswahlmenü

In einer Objektart werden verschiedene Datenfelder so gebündelt, daß sie alle für einen bestimmten Zweck, zB. die Erfassung eines Belegs, erforderlichen Informationen aufnehmen kann. Für jede Objektart wird eine eigene Erfassungsmaske [11] definiert. Die Verwaltung der einzelnen Objekte in der Datenbank erfolgt numerisch, das heißt, jedem Objekt wird eine Objektnummer zugeordnet.
Für den Druck der Wörterbuchartikel werden die entsprechenden Daten aus der Datenbank exportiert, das Layout und die typographische Gestaltung werden mit Druckmakros gesteuert, die vom Anwender selbst zu gestalten sind.

3. Die Belegerfassung

Die folgende Abbildung 3 zeigt die Erfassungsmaske für die Belegeingabe (also für die Objektart Beleg in der Dokumentation Manuskript).

Abb. 3: Erfassungsmaske für die Belegeingabe

beleg_3.gif (508790 Byte)

Kommentierung der Erfassungsmaske

--> Dieser Pfeil dient der Kennzeichnung einer sogenannten Referenz, also der Verknüpfung von Informationseinheiten innerhalb der einzelnen Objekte oder Dokumentationen.

zu Gliederungsebene: Hier erfolgt die Zuordnung des Belegs zum entsprechenden Erläuterungsteil des Wörterbuchartikels. Ausführlicher dazu in Kap. 3.1.

Referenz auf Artikel: Dieses Feld dient der Zuordnung des Belegs zum entsprechenden Erläuterungsteil beim Export aus der Datenbank (für einen Ausdruck des Artikels). - Die Einträge in diesem Feld werden indexiert, in diesem Index sind alle Belege zu einem Wort, bei polysemen Wörtern: zum entsprechenden Gliederungspunkt eines Wortes recherchierbar.

Beleg weglassen? Wird dieses Feld ausgefüllt, dann wird der Beleg nicht ausgedruckt.

Nur Fundstelle? Füllt man dieses Feld aus, erscheint der Beleg im Ausdruck als Fundstellenangabe ohne Wiedergabe des Belegzitats.

verwendet bei: Kennzeichnet die Mehrfachverwendung von Belegen (Verweisbelege).

Belegtext: Eingabe des Belegzitats; ausführlicher dazu in Kap. 3.2.

Sigle: Eintrag der Quellenabkürzung; ausführlicher dazu in Kap. 3.3. - Die Einträge werden indexiert; im Index 'Zitierte Quellen' ist eine Recherche nach allen zitierten Belegen aus einer bestimmten Quelle möglich.

Datierung: Eintrag der Datierung des Belegs.

Sortierdatierung: Die Wiedergabe der Belege in den Wörterbuchartikeln erfolgt in chronologischer Reihenfolge. Der Eintrag in diesem Feld steuert die chronologische Sortierung der Belege durch das Programm. - Die Einträge werden indexiert; im Index 'Sortierdatierung' kann man Belegrecherchen unter chronologischen Aspekten durchführen.

Fundstelle: Eintrag der Fundstelle des Belegs

Region/Textsorte: Angabe der regionalen Zuordnung eines Belegs z.B. bei Weistumssammlungen [12] bzw. Textsortenspezifizierung bei Zitaten aus Wörterbüchern oder kleineren Sammlungen mit unterschiedlichen Texten[13]. - Der auf diesen Einträgen basierende Index 'Region/Textsorte' ist für entsprechende Recherchen also nur bedingt und in Kombination mit Recherchen zur Quellensigle verwendbar.

Faksimile: --> Referenzierung zur entsprechenden Seite in der Faksimiledokumentation; ausführlicher in Kap. 4.3.

Textarchiv: --> Referenzierung zur entsprechenden Seite in der Dokumentation der maschinenlesbaren Texte; vgl. dazu Kap. 4.2.

Weitere Angaben: Eintragung von zusätzlichen Angaben unterschiedlicher Art, die in den Ausdruck des Wörterbuchartikels mit übernommen werden.

andere Quelle: In seltenen Fällen werden in den Wörterbuchartikeln Belege aus Texten zitiert, die nicht zum Quellenkorpus des DRW zählen. In diesem Fall wird statt der Quellensigle der Titel des Texten in diesem Feld eingetragen.

Kommentarfeld: Dieses Feld dient dem Eintrag aller möglichen, für die Wörterbucharbeit relevanten Kommentare zum Beleg, die z.B. bei der redaktionellen Überarbeitung eine Entscheidungshilfe für das Kürzen der Wörterbuchartikel sein können. Dieses Feld wird nicht ausgedruckt.

Syntagma: Eintragung der syntaktischen Verbindung des Belegwortes

Belegklassifik.: Eintrag der Textsorte, wobei wir nicht über ein eigenes Textsortensystem verfügen, sondern die in den Quellen selbst verwendeten Klassifikationen verwenden. - Die Einträge in diesem Feld werden indexiert.

Verwandter Beleg --> Von diesem Feld aus werden Referenzen zu Belegen mit einer inhaltlichen Gemeinsamkeit hergestellt, die sich nicht auf der Ebene der lexikalischen Vernetzung in den Erläuterungsteilen darstellen läßt, also z.B. derselbe Wortlaut einer normativen Aussage in unterschiedlichen Texten in einem Wörterbuchartikel oder derselbe oder ähnliche Wortlaut eines normativen Textes in verschiedenen Wörterbuchartikeln. Damit lassen sich also in der lexikographischen Datenbank z.B. Rechtstraditionen darstellen, die Felder sind recherchierbar.

- Verwandter Beleg --> Eintrag der Gegenreferenz, die automatisch gesetzt wird.

Beleg gedruckt --> Entfällt künftig.

Lautverweis-Obj.: --> Das mehrsprachige Corpus des DRW erfordert sog. Lautverweise, das sind Verweise von einer besonders ausgefallenen Belegwortgraphie auf das entsprechende Lemma (z.B. von ofentüre auf Abenteuer oder von oxan auf Ochse). Die Lautverweise sind über dieses Referenzfeld mit dem zugehörigen Beleg verbunden.

gleiche Dat.? bis anderer Band: Diese Feldergruppe wird ausgefüllt, wenn mehrere Belege aus einer Quelle zitiert werden. Die Eintragungen in diesen Feldern steuern die Umsetzung der Fundstellenangabe ebd. im Ausdruck des Wörterbuchartikels.
Korrekturobjekt: Dieses Feld ist in Vorbereitung. Korrekturvorschläge sollen über dieses Feld mit dem entsprechenden Beleg verbunden werden.

erfasst durch: Die Eintragung des Bearbeiters oder der Bearbeiterin erfolgt automatisch beim Anlegen des Belegobjektes. Das Feld ist recherchierbar und dient in Kombination mit dem folgenden Feld statistischen Erhebungen innerhalb der Forschungsstelle.

Erfassung: Eintragung des Erfassungsdatums, erfolgt ebenfalls automatisch.

verändert: Derjenige Bearbeiter bzw. diejenige Bearbeiterin, die ein Belegobjekt anstelle der ursprünglichen Person verändert, soll hier das Namenskürzel eintragen.

letzte Änderung: Wird das Objekt zur Korrektur aufgerufen, erfolgt hier automatisch der Eintrag des aktuellen Datums.
Abweichung Druck: Dieses Feld wird ausgefüllt, wenn nach der Publikation des Wörterbuchartikels am Beleg nochmals Veränderung vorgenommen werden.

3.1. Referenz zur Gliederung
Die folgende Abbildung 4 zeigt in der linken Bildhälfte wiederum die Erfassungsmaske für Belege, in der rechten Bildhälfte ist die Indexliste Gliederung eingeblendet. Sie enthält die Wörterbuchartikel in alphabetischer Reihenfolge, sowie bei polysemen Wörtern die einzelnen Gliederungspunkte der Wörterbuchartikel.

Abb. 4: Belegerfassungsmaske mit eingeblendeter Artikelgliederungsliste

beleg_4.gif (284745 Byte)


In den ersten beiden Feldern der Belegerfassungsmaske erfolgt die Zuordnung eines Beleges zu einer Bedeutung. Vom ersten Feld mit der Bezeichnung zu Gliederungsebene:, einem Referenzfeld, kann man sich die Gliederungsliste der Wörterbuchartikel einblenden, man kann in dieser Liste blättern oder gezielt darin suchen, und mit einer Funktionstaste kann man sich die Bedeutungsangaben ansehen. Mit einer weiteren Funktionstaste kann man das Belegobjekt einer Bedeutung zuordnen - in der Datenbanksprache heißt dies: eine Referenz herstellen.
Diese Referenzen werden bei der Bearbeitung der Wörterbuchartikel automatisch berücksichtigt: das heißt, stellt man die Gliederung eines polysemen Wortes um, ändert sich die Belegzuordnung automatisch.
Das zweite Feld Referenz auf Artikel dient der Sortierung und Zuordnung der Belege für den Ausdruck der Wörterbuchartikel.

 

3.2. Das Feld Belegtext
Abbildung 5 zeigt den Ausschnitt einer ausgefüllten Belegerfassungsmaske.

Abb. 5: Belegerfassungsmaske (Ausschnitt)
fehlt leider


Das Feld Belegtext ist ein frei beschreibbares Feld, in das das Belegzitat eingegeben wird. Für dieses Feld besteht die Möglichkeit der Verdoppelung, die wir für die redaktionelle Bearbeitung der Belegzitate nutzen, die hauptsächlich in der Kürzung des Zitattextes besteht. Die ursprünglich eingegebene Langversion des Belegzitates bleibt in der Datenbank erhalten, im Ausdruck erscheint hingegen nur noch die gekürzte Version.
Dieses Feld ist ein sogenanntes Invertierungsfeld, d.h., daß die einzelnen Zeichenketten in diesem Feld beim Abspeichern des Objektes einer alpha-numerisch sortierten Liste hinzugefügt werden und für Indexrecherchen sofort zur Verfügung stehen. Auf diese Art und Weise wird in der lexikographischen Datenbank eine Belegwortliste geführt, die ständig auf aktuellem Eingabestand ist.
Diese Invertierungsfunktion ermöglicht auch eine Schnellrecherche nach Belegwörtern, die für die lexikographische Arbeit von großem Nutzen ist: setzt man den Cursor auf ein Wort im Text und macht einen doppelten Mausklick, so erhält man sofort den Zugriff auf sämtliche Belegobjekte, in denen das angeklickte Wort in der identischen Schreibweise enthalten ist. Dies ist die einfachste Technik zur Behebung von Datenerhebungslücken, es ist aber auch eine Möglichkeit, die eigene Verstehenskompetenz rasch zu erweitern: indem man die anderen Texte liest, lernt man auf die rascheste Art und Weise den Gebrauch eines Wortes in den unterschiedlichen Belegtexten besser kennen und erhält natürlich auch ein differenziertes Sachwissen, was bei einem fachsprachlichen Wörterbuch nicht unwesentlich ist.


3.3. Die Quellensigle
Abbildung 6 zeigt auf der linken Seite wiederum eine ausgefüllte Belegerfassungsmaske (in der Dokumentation Manuskript), auf der rechten Seite ist das Objekt mit der Titelaufnahme der im Beleg zitierten Quelle mit der Sigle TeutschForm. aus der Dokumentation drwtitel eingeblendet.

Abb. 6: Belegerfassungsmaske mit Referenz zur Titeldokumentation (Ausschnitt)

beleg_6.gif (294966 Byte)

Das Feld Sigle für den Eintrag des Quellennachweises ist ein Referenzfeld. Die Quellenabkürzungen werden also nicht von Hand eingegeben, sondern aus der Titeldokumentation heraus in dieses Feld einkopiert. Dabei kann die gesuchte Sigle in ein Suchfeld mit der Mindestzahl von Zeichen hineingeschrieben werden, die eine eindeutige Identifikation ermöglicht. Als Ergebnis wird der entsprechende Eintrag gezeigt und kann mit einem Tastendruck in das Belegobjekt übernommen werden. Fortan steht das entsprechende Titelobjekt an dieser Stelle in der Belegerfassungsmaske über die Referenztechnik mit allen enthaltenen Informationen zur Verfügung. Und dies sind neben den bibliographischen Angaben zur Quelle auch Angaben zur Datierung der Quelle, zur Zitierweise, zum Standort, aber auch zu verwandten Texten oder zur zugehörigen Sekundärliteratur.

4. Die Quellengrundlagen

Die Grundlage für die Erarbeitung der Wörterbuchartikel ist das Belegarchiv mit seinen mehr als 2,2 Mio. Belegzetteln.
Die Exzerption erfolgte hauptsächlich in den Anfangsjahrzehnten des DRW [14], also Ende des 19. und Anfang des 20. Jhs. Sie war zum größten Teil von freiwilligen Helferinnen und Helfern durchgeführt worden. Das Ergebnis ist ein extrem inhomogenes Zettelarchiv, wie die folgende Abbildung 7 von zwei beliebig ausgewählten Beispielen zeigt.

Abb. 7: Belegzettel aus dem DRW-Archiv

beleg_7.gif (359693 Byte)

Wie das Beispiel zeigt, kann die Belegaufnahme in die Datenbank also nicht etwa anhand der Exzerptzettel erfolgen, sondern muß jeweils anhand der Quellentexte vorgenommen werden. Das Zettelarchiv dient dabei als Fundstellenverzeichnis.


4.1. Bücher
In der Regel müssen die Bearbeiterinnen und Bearbeiter des DRW für die Eingabe der Belegzitate die entsprechende Quelle zur Hand nehmen und das Belegzitat von Hand eingeben. Dies ist aufwendig, denn es bedeutet, daß man pro Beleg von seinem Arbeitsplatz aufsteht, an die Regale geht, die über sieben Räume verteilt sind, das Buch mit an seinen Arbeitsplatz nimmt und nach der Benutzung möglichst rasch wieder an den Standort zurückbringt. Der Aufwand erhöht sich natürlich noch um einiges, wenn das Buch bestellt werden muß. Hinzu kommt, daß sich diese Vorgänge bei der redaktionellen Überarbeitung in vielen Fällen noch einmal wiederholen.


4.2. Maschinenlesbare Texte
Daher sind wir außerordentlich daran interessiert, so viele maschinenlesbare Texte wie möglich in die Datenbank zu importieren. Ist dieser Import erst einmal erfolgt, können wir in den einzelnen Texten verschiedene Recherchen vornehmen, wir können beliebige Textausschnitte markieren und in das Belegobjekt einkopieren. Die Vorteile dieses Verfahrens liegen auf der Hand. Leider sind wir nicht selbst in der Lage, unser Corpus mit seinen rund 8.000 Quellen maschinenlesbar zu machen. Dankenswerterweise haben uns schon einige Institutionen, Herausgeber und Verlage die maschinenlesbaren Fassungen von Texten zur Verfügung gestellt [15], und wir nehmen natürlich jedes diesbezügliche Angebot, sei es entgeltlich oder unentgeltlich, dankbar an.
Die maschinenlesbaren Texte sind in einer eigenen Dokumentation untergebracht. Neben Volltext-, String- und numerischen Recherchen sind u.a. Abfragen in Indices zu den Wortbelegungsformen, Seiten und Stichwörtern möglich.

Abb. 8: Rechercheauswahl und Textseite eines maschinenlesbaren Textes in der Datenbank

beleg_8.gif (329930 Byte)

In Abbildung 8 sieht man auf der linken Seite die Indexierung der Quellen mit den zugehörigen Seitenzahlen, auf der rechten Seite den eingeblendeten Volltext der links im Index mit dem Balken markierten Quellenseite [16].
Bei der Belegaufnahme aus einem maschinenlesbaren Quellentext geht man über das entsprechende Referenzfeld in der Erfassungsmaske in die Dokumentation für maschinenlesbare Texte, sucht den erforderlichen Text über den entsprechenden Index, geht über die entsprechende Seite in den Text hinein, wählt den Zitatausschnitt, kopiert ihn in eine Zwischenablage, geht zurück in das Belegobjekt und holt den Text aus der Zwischenablage in das Belegfeld - insgesamt ein sekundenschneller Vorgang. Über die Referenzierung im Belegerfassungsfeld steht der Volltext fortan für weitere Belegbearbeitungsschritte immer zur Verfügung.

4.3. Elektronische Faksimiles
Das FAUST-Programm verfügt über ein Bildarchiv. Dieses Bildarchiv haben wir in unsere lexikographische Datenbank integriert und nutzen es, um von bestimmten Quellen elektronische Faksimiles anzulegen, so daß die entsprechenden Buchseiten als Graphikdateien in der Datenbank abgelegt und unter der jeweiligen Quellensigle verwaltet werden. Damit ist bei der Belegerfassung der sofortige Zugriff auf diese Gruppe von Quellentexten möglich. In diesem Fall müssen die Belege allerdings von Hand aus der Faksimile-Datei abgeschrieben werden. Wir haben in der Belegmaske ein Referenzfeld zur Faksimiledokumentation eingerichtet, so daß man nach der Belegerstellung jederzeit auf raschem Weg sich die entsprechende Faksimileseite auf den Bildschirm holen - und bei entsprechendem Bedarf - auch ausdrucken kann. Abbildung 9a zeigt die Belegerfassungsmaske eines Beleges, der als elektronisches Faksimile im Bildarchiv vorliegt. Die Referenzierung zur entsprechenden Grafikdatei erfolgt in dem Feld Faksimile: mit dem entsprechenden Referenzierungspfeil -->.

Abb. 9a: Belegobjekt mit Referenz zur Faksimileseite

beleg_9a.gif (277016 Byte)

Über das Referenzfeld kommt man mit der entsprechenden Funktionstaste auf die zugehörige Scan-Seite, deren Vollbild die folgende Abbildung 9b zeigt.

Abb. 9b: Grafikdatei, die zwei Seiten eines elektronischen Faksimiles abbildet

beleg_9b.gif (392968 Byte)

Der lexikographische Nutzen dieses Zugriffs auf den Originaltext liegt auf Hand: Binnenauslassungen des Belegzitats sind irrelevant, und da man in diesen Grafikdateien seitenweise blättern kann, spielt der Belegschnitt für ein umfassenderes begriffliches Verständnis des Benutzers keine Rolle mehr. Damit wird das elektronische Belegarchiv zu einem Arbeitsmittel für jede begriffsgeschichtliche Fragestellung, die auf den Volltext als Untersuchungsgrundlage angewiesen ist [17].

5. Die Arbeit mit dem elektronischen Belegarchiv

Es zählt zu den Serviceleistungen der Forschungsstelle, Anfragen zu beantworten und das Belegmaterial auch zur Verfügung zu stellen. Kleine Belegmengen werden bei entsprechenden Anfragen für die Benutzerinnen und Benutzer kopiert, größere Belegmengen konnten bisher nur in der Forschungsstelle in Heidelberg eingesehen werden.
Für die Zukunft bieten wir neben der Benutzung des Belegzettelarchives auch die Benutzung unserer Datenbank an. Die Softwarefirma plant die Entwicklung eines Datenbankserverprogrammes, so daß für die Zukunft auch die Arbeit mit der lexikograpischen Datenbank des DRW im Internet möglich sein wird.

5.1.Für die Arbeit mit den Belegen stehen dabei unter anderem folgende Recherchemöglichkeiten [18] zur Verfügung:

1. Man kann sich über die neuhochdeutsche Lemmaliste (= Indexliste Gliederung) alle zugehörigen Belegzitate holen. Diese sind unter Umständen wesentlich zahlreicher als im gedruckten Wörterbuch und sie stehen häufiger in einem größeren Kontext als in der Druckfassung zur Verfügung.
2. Man hat die Möglichkeit der Volltext- oder Stringrecherche.
3. Eine weitere Möglichkeit ist die Auflistung aller Wortbelegungsformen.
4. Oder man kann sich auch die Belege einer bestimmten Region, eines bestimmten Zeitraumes oder einer bestimmten Textsorte ansehen,
5. oder aber sich alle Belege aus einer bestimmten Quelle holen.

Mit anderen Worten: die von uns im Rahmen der Wörterbucharbeit zusammengetragenen Belegzitate können im Sinne eines Datentransfers oder der Datenbankrecherche für vielfältige Fragestellungen aus den Bereichen der Rechts- und Sprachwissenschaft genutzt werden.
Eine Hürde bei der problemlosen Übernahme unseres Sprachmaterials stellt allerdings unsere Zitierweise dar, da wir die Belegzitate nicht diplomatisch genau, sondern mit einigen Žnderungen aus der Quelle abgeschrieben werden.
Daher wurde an uns die Bitte herangetragen, die Verdoppelungsfunktion des Belegtextfeldes dazu zu nutzen, um einmal den diplomatisch getreuen Text aufzunehmen, und dann im zweiten Feld die redaktionell überarbeitete Fassung herzustellen. Die Vorstellung eines größeren Schreibaufwandes schreckte uns, aber die Scheu vor Zusatzarbeiten macht bekanntlich erfinderisch. Daher haben wir uns überlegt, daß wir die Faksimilefunktion des Programmes dazu nutzen könnten, um das jeweilige Textumfeld des von uns aufgenommenen Belegzitates aus der Quelle einzuscannen, aber auf die zeitaufwendige Umrechnung in Ascii-Dateien zu verzichten, und statt dessen den eingescannten Text als Bilddatei in FAUST abzulegen und von den jeweiligen Belegobjekten aus Referenzen auf die entsprechenden Bilddateien zu legen.
Auf diese Weise kann man sich beim Lesen oder Bearbeiten der Belege mit Tastendruck die Originaltextseite auf den Bildschirm holen und sie gegebenenfalls auch problemlos als Bilddatei ausdrucken.
Die Scanzeit und die Einbindung des Faksimiles dürfte einen geringeren zeitlichen Aufwand ausmachen als die diplomatisch genaue Abschrift eines Textausschnittes und die erforderlichen Korrekturgänge und die Zitatbearbeitung.

5.2. Dieses Verfahren hat mehrere Vorteile:

1. Für unsere Wörterbucharbeit bedeutet es eine eindeutige organisatorische Entlastung. Man kann das Belegzitat für den Wörterbuchartikel knapper schneiden, ggfs. entfällt das Kürzen der Zitate im Redaktionsgang. Den für die Plausibilitätskontrolle der Bedeutungserläuterung sehr häufig benötigten größeren Kontext kann man sich auf der Faksimileseite ansehen. Dies wiederum heißt, daß man künftig die Quelle nur noch einmal zur Hand nehmen muß, und nicht mehrmals, wie bisher. - Ein nicht unwesentlicher Aspekt ist dabei auch die Schonung der kostbaren alten Drucke.
2. Die Benutzer unserer Datenbank haben auf die eingescannten Textseiten den selben Zugriff, sind also nicht mehr darauf angewiesen, für ihre eigenen Arbeiten entweder das von den Bearbeitern und Bearbeiterinnen des DRW erstellte Zitatmaterial zu übernehmen, oder alles noch einmal anhand der Quelle selbst zu verifzieren.

6. Zusammenfassung und Ausblick

Die Einrichtung der lexikographischen Datenbank mit den vorgestellten Recherchemöglichkeiten ist auf die Wörterbucharbeit mit allen lexikographischen Fragestellungen und Prüfmethoden zugeschnitten. Die Arbeitsmöglichkeit mit unserem elektronischen Belegarchiv ist von unserer Seite aus ein Nebenprodukt unserer Wörterbucharbeit, so daß es bei bestimmten Fragestellungen auf die Findigkeit der Rechercheabfrage, auf Kombinationen von Recherchen und vielleicht auch auf ein bißchen Fleißarbeit beim Auswerten der Rechercheergebnisse ankommt.
Für das DRW hat sich die Umstellung auf die EDV, und insbesondere die Arbeit mit und in der Datenbank gelohnt:
- Band VII des DRW, mit getipptem Manuskript und konventionellem Drucksatz wurde in 11 Jahren erstellt.
- Für Band VIII reduzierte sich die Bearbeitungszeit auf 7 1/2 Jahre, etwa die Hälfte des Bandes wurde mit EDV-Mitteln erarbeitet.
- Und für Band IX, vollständig mit EDV erarbeitet, davon zur Hälfte in der Datenbank, haben wir nur noch 5 1/2 Jahre benötigt.

7. Literatur

Dickel, Günther / Speer, Heino (1979): Deutsches Rechtswörterbuch. In: Helmut Henne (Hrsg.),
Praxis der Lexikographie. Berichte aus der Werkstatt. Tübingen: 20-37. (RGL 22).
Kammerer, Matthias (1995): Bildschirmorientiertes Abfassen von Wörterbuchartikeln. Dargestellt am Beispiel
des Frühneuhochdeutschen Wörterbuches. Tübingen. (Lexicographica Series Maior 68).
Lemberg, Ingrid (1996): Die Entstehung des Deutschen Rechtswörterbuches. In: Lexicographica.
Internationales Jahrbuch zur Lexikographie 12, 105-124.
- (1996a): Die Belegexzerption zu historischen Wörterbüchern am Beispiel des Frühneuhochdeutschen
Wörterbuches und des Deutschen Rechtswörterbuches. In: Wörterbücher in der Diskussion II. Vorträge aus dem Heidelberger Lexikographischen Kolloquium. Hrsg. von Herbert Ernst Wiegand. Tübingen, S. 83-102. (Lexicographica, Series Maior 70).
- (1997): Lexikographische Erläuterungen im Deutschen Rechtswörterbuch: Gestaltungsmuster in einem
Wörterbuch der älteren deutschen Rechtssprache. Erscheint in: Wörterbücher in der Diskussion III. Vorträge aus dem Heidelberger Lexikographischen Kolloquium. Hrsg. von Herbert Ernst Wiegand. Tübingen (im Druck).
Lemberg, Ingrid / Petzold, Sybille / Speer, Heino (1997): Der Weg des Deutschen Rechtswörterbuchs
in das Internet. Erscheint in: Wörterbücher in der Diskussion III. Vorträge aus dem Heidelberger Lexikographischen Kolloquium. Hrsg. von Herbert Ernst Wiegand. Tübingen (im Druck).
Lemberg, Ingrid / Speer, Heino (1997): Bericht über das Deutsche Rechtswörterbuch.
Erscheint in: Zeitschrift der Savigny-Stiftung für Rechtsgeschichte 114, 679-697.
Munske, Horst Haider (1988): Rezension zum Deutschen Rechtswörterbuch. In: Anzeiger für deutsches
Altertum und deutsche Literatur. Bd. 99, Heft 1, 5-17.
Reichmann, Oskar (1977): Rezension zu: Deutsches Rechtswörterbuch. Wörterbuch der älteren
deutschen Rechtssprache [...] Bd. VII, Hefte 1-4. In: Muttersprache. Zeitschrift zur Pflege und Erforschung der deutschen Sprache. 87, 197-204.
Schröder, Martin (1997): Brauchen wir ein neues Wörterbuchkartell? Zu den Perspektiven einer
computergestützten Dialektlexikographie und eines Projekts "Deutsches Dialektwörterbuch". In: Zeitschrift für Dialektologie und Linguistik LXIV, Heft 1, 57-66.
Speer, Heino (1979): s. Dickel/Speer.
- (1989): Das Deutsche Rechtswörterbuch. Historische Lexikographie einer Fachsprache.
In: Lexicographica. Internationales Jahrbuch zur Lexikographie 5, 85-128.
- (1991): Das Deutsche Rechtswörterbuch: Vorstellung des Wörterbuchs und lexikographische Praxis
am Beispiel "magdeburgisch". In: Historical Lexicography of the German Language. Edited by Ulrich Goebel and Oskar Reichmann in collaboration with Peter I. Barta. Lewiston/Queenston/Lampeter, vol. 2, 675-711. (Studies in Russian and German 2).
- (1994): DRW to FAUST. Ein Wörterbuch zwischen Tradition und Fortschritt. In: Lexicographica.
Internationales Jahrbuch zur Lexikographie 10, 171-213.
- (1997): s. Lemberg / Speer.

Endnoten:

durch Anklicken der Fußnotenzahl gelangen Sie zurück zum Text!

( 1 ) Vgl. dazu Lemberg/Petzold/Speer 1997.

( 2 ) Stand: August 1997.

( 3 ) Zur Konzeption des DRW vgl. Dickel/Speer 1979; Lemberg 1997; Reichmann 1977; Speer 1989 u. 1991; zur Geschichte des DRW: Lemberg 1996; Lemberg/Speer 1997.

( 4 ) So eine Rezension zum DRW in der internationalen Ausgabe der Neuen Züricher Zeitung vom 1./2. März 1997.

( 5 ) Vgl. Lemberg 1997.

( 6 ) Dazu ausführlich mit Beispielen Speer 1991.

( 7 ) Als Erscheinungstermin ist der Oktober 1997 vorgesehen. Das Wörterbuch ist auf 16 Bände konzipiert, es soll im Jahr 2032 abgeschlossen werden.

( 8 ) Alle Schritte der Computerisierung wurden von dem Leiter der Forschungsstelle, Dr. Heino Speer, selbst erarbeitet und durchgeführt. Die einzelnen Schritte der Computerisierung sind von ihm in einer Dokumentation dargestellt (Speer 1994).

( 9 ) Ein Produkt der Firma Doris-Land-Software-Entwicklung (http://www.land-software.de).

( 10 ) Vgl. dazu die Abbildungen bei Kammerer 1995, 103/4.

( 11 ) Diese Erfassungsmasken sind nicht starr festgelegt, sondern können während der laufenden Arbeit jederzeit geändert werden. Man ist also im Unterschied zu einem konventionellen Datenbanksystem nicht gezwungen, die Erfassungsfelder im vorhinein und ein für alle mal festzulegen. Und wir haben auch viele Erfassungsmasken im Lauf der praktischen Arbeit mit dem Programm noch optimiert und die Felder auch reduziert.

( 12 ) Die Zitierweise im Wörterbuchartikel sieht wie folgt aus: Eifel/GrW. II (= Edition der Grimmschen Weistumssammlung), Preußen/Sehling,EvKO. (Sammlung evangelischer Kirchenordnungen).

( 13 ) Vgl. zum Beispiel die Quellensiglen Ahd.Benediktinerregel/AltTBibl. 50 oder Beda/BiblAgsProsa.

( 14 ) Vgl. dazu Lemberg 1996a.

( 15 ) Das Verzeichnis der maschinenlesbaren Texte ist in der Homepage des DRW aufgelistet.

( 16 ) Die maschinenlesbare Fassung der Deutschordensstatuten im vorliegenden Beispiel wurde uns dankenswerterweise von der Trierer Forschungsstelle zum Neuen Mittelhochdeutschen Wörterbuch unter der Leitung von Kurt Gärtner zur Verfügung gestellt.

( 17 ) Vgl. dazu Lemberg/Petzold/Speer 1997, Kap. 8.1.

( 18 ) Eine andere Erweiterung der Recherchemöglichkeiten in unserer Datenbank ist die unverzichtbare Integrierung der bereits gedruckten Bände. Band V - VIII liegen bereits maschinenlesbar, aber zum Teil noch nicht korrigiert vor. Wir haben hierzu das Programm OPTOPUS der Firma Macrolog benutzt und die Arbeiten durch Hilfskräfte ausführen lassen. Band VIII ist nahezu vollständig in die Datenbank importiert worden. Um eine Vorstellung von dem dazu erforderlichen Zeitaufwand zu vermitteln: Herr Speer hat mit der Bearbeitung des Quelltextes von rund 800 Spalten, also einem halben Band, vor etwa drei Monaten begonnen. Der nur mit Schriftartenkennzeichnung versehene Fließtext wurde von ihm mit Hilfe eines normalen Texteditors, der allerdings über eine an REXX angelehnte sehr umfangreiche Macro-Sprache verfügt, in vielen Durchläufen und mit immer wieder neu formulierten Macros, zum Teil aber auch mit händischen Korrekturen in solche Sinneinheiten zerlegt, die den Datenbankfeldern entsprechen. Das Parsen eines historischen Wörterbuchs scheint sich nur auf eine derart pragmatische Weise erledigen zu lassen. Sein Zeitaufwand betrug hierfür etwa siebzig Stunden reine Arbeitszeit, die allerdings neben der Manuskripterstellung und den Korrektur- sowie normalen Verwaltungsarbeiten zu leisten waren. Das Ergebnis - eine Textdatei von rund 410.000 Zeilen, die etwa 26.000 neue Objekte in Faust ergaben - läßt diesen Aufwand als durchaus vertretbar erscheinen.

web design: Sandra Waldenberger last update: 12.01.1999 Homepage
Publikationen
Vorträge