Normen Licht im Normen-Dunkel – Immer bessere Produkte und Services dank Datenhaltung in SGML

Redakteur: Karl-Ullrich Höltkemeier

Normen sind unverzichtbare Ordnungsinstrumente der Wirtschaftswelt. Angefangen hat es mit der ersten deutsche Norm – der DIN 1 Kegelstifte – im Jahr 1918. Bis heute hat das Deutsche Institut für Normung e.V. (DIN) rund 26.000 Deutsche Normen erstellt. Damit sich Ingenieure, Ökonomen, Juristen und alle Interessierten im Normen-Dschungel zurechtfinden, werden im Beuth Verlag immer neue Produkte und Dienstleistungen entwickelt, die die Arbeit mit den Normen erheblich erleichtern. Dabei setzt das Unternehmen unter anderem auf die Datenhaltung in SGML bzw. XML und die Zusammenarbeit mit der Ovidius.

Firmen zum Thema

1. Beispiel DELTAdoc, Beispiel für Bilder
1. Beispiel DELTAdoc, Beispiel für Bilder
( Archiv: Vogel Business Media )

Durch das DIN und den Verein Deutscher Ingenieure (VDI) wurde 1924 der Beuth Verlag gegründet. Ziel der Gründer war es, eine zentrale Bezugsquelle für den gesamten Normenbestand zu schaffen.

Veröffentlicht werden die Regelwerke vor allem als Taschenbücher, Loseblattsammlungen und PDF-Dateien im Abo oder zum Download. 32 Prozent der Publikationen werden heute mittlerweile über die Website des Verlags verkauft. Seit 2000 bietet der Verlag zusätzlich den Online-Zugriff auf DIN-Normen und andere technische Dokumente an. Daneben erfreuen sich neue elektronische Online-Produkte, wie etwa die Vergabe- und Vertragsordnung für Bauleistungen (www.vob-online.de), wachsender Nachfrage:

Bildergalerie

Datenhaltung in SGML

Eine Norm umfasst im Schnitt 20 Seiten. Von 1918, dem Erscheinungsjahr der ersten deutschen Norm, bis heute haben sich riesige Datenmengen bei Beuth angesammelt. Anfang der neunziger Jahre begann man darüber nachzudenken, wie sich die immer weiter wachsenden Datenmengen zukunftssicher verwalten lassen. Die Lösung sollte SGML (Standard Generalized Markup Language) lauten.

„Mit SGML lassen sich Daten unabhängig von der eingesetzten Software langfristig verfügbar machen“, erläutert Andreas Wernicke, Projektleiter für neue Entwicklungen und Technologien im Beuth Verlag, eine der wichtigsten Eigenschaften des Datenformats.

Dabei bietet eine Datenarchivierung in SGML viele Vorteile: Durch die Kodierung in SGML eröffnen sich präzise Suchmöglichkeiten. So lassen sich im Volltext beispielsweise auch Tabellen und Formeln gezielt durchsuchen. Außerdem sind die Dokumente in SGML medienneutral, das heißt, sie können problemlos in den verschiedenen Formaten publiziert werden.

Mit verbesserten Such- und Publikationsmöglichkeiten allein wollte man sich bei Beuth jedoch nicht zufrieden geben. Man erkannte, dass sich durch den Einsatz von SGML große Potenziale zur Steigerung der Produktivität und der Ausweitung des Produkt- und Serviceportfolios boten – und dies nicht nur für Beuth, sondern auch für die Arbeit des DIN.

Terminologiedatenbank

„Als erstes stellten wir den Umgang mit der Terminologie auf den Prüfstand“, erinnert sich Wernicke. Die genaue Definition von Begriffen und deren immer gleiche Verwendung in den Normen ist eine Grundvoraussetzung der Normungsarbeit. Die Idee war, die Terminologie aus den Normen automatisch zu extrahieren und in einer Datenbank ablegen zu können. Zuvor konnten neue Begriffe im besten Fall per „Cut & Paste“ aus den Normen in eine Datenbank übernommen werden, meist mussten sie jedoch nochmals erfasst werden.

Unterstützung bei der Verwirklichung dieser Pläne erhielt der Beuth Verlag von Ovidius. Das Berliner Unternehmen entwickelt auf der Basis von SGML und XML Softwarelösungen für das Erstellen, Verwalten und Publizieren komplexer Dokumente. Gemeinsam mit den Experten von Ovidius und der Terminologiestelle im DIN entwickelte Andreas Wernicke einen Automatismus zur Begriffsextraktion, durch den im DIN der Erfassungsaufwand für die Begriffe um 30 Prozent reduziert werden konnte. Grundlage der Lösung war MetaMorphosis, die Transformationssoftware von Ovidius.

Datenbank umfasst mehr als 225.000 Einträgen

„So konnten wir unsere internen Arbeitsabläufe mit Hilfe von Ovidius und MetaMorphosis verbessern, und den Datenbestand für DIN-TERM mit spürbar weniger Aufwand pflegen“, so Wernicke. DIN-TERM ist die Terminologiedatenbank des DIN, die als CD-ROM über den Beuth Verlag bezogen werden kann.

Die Datenbank umfasst mit mehr als 225.000 Einträgen rund 98 Prozent aller Begriffe in Normen – und das zum größten Teil in Deutsch, Englisch und Französisch. Umfangreiche Recherchemöglichkeiten ermöglichen dem Benutzer eine gezielte Suche in dem Datenbestand.

Normenvergleich im DELTAdoc

Im Beuth Verlag erkannte man noch weitere Potenziale, die sich durch die Daten in SGML und den Einsatz eines leistungsfähigen Programmierwerkzeugs wie MetaMorphosis boten. Da auch Normen sich ändern, wurde die Idee entwickelt, den Vergleich verschiedener Versionen einer Norm zu automatisieren. Gemeinsam mit Ovidius realisierte der Verlag DELTAdoc, einen Dokumentenvergleich zwischen einer aktuellen Norm und ihrer früheren Ausgabe.

DELTAdocs werden als PDF-Dateien zum Download angeboten. Ähnlich wie bei der Funktion „Dokumente vergleichen“ in MS Word werden Änderungen von der früheren Ausgabe zur aktuellen Norm in dem Dokument farblich gekennzeichnet. Geänderte Passagen sind auf einen Blick durch einen randseitigen Balken erkennbar. Streichungen werden rot markiert und die Textpassagen durchgestrichen. Wird neuer Text in die Norm eingefügt, so sind diese Passagen blau markiert und unterstrichen.

DELTAdoc leistet jedoch mehr als die klassischen Office-Werkzeuge: Es werden nicht nur Texte verglichen, sondern auch die Formeln und Bilder der Norm. Falls nötig, werden alte und neue Bilder und Formeln neben- bzw. untereinander gestellt, so dass der Benutzer schnell und einfach die Unterschiede erkennen kann. Bei umfangreichen Streichungen werden nur Anfang und Ende wiedergegeben und die Auslassung markiert. So wird die Übersichtlichkeit im DELTAdoc im Vergleich zu den Ergebnissen aus Standardprodukten wesentlich erhöht. (hö)

Beuth Verlag

Tel. +49(0)30 2601 0

Artikelfiles und Artikellinks

(ID:200519)