Das REx-Format zur metrischen Untersuchung der Wiederverwendung im Content Management aus Datenschutzsicht

Big Data und Content Intelligence

Big Data ist allgegenwärtig. Nicht nur in Lindau, wo die Ursprünge der ICMS GmbH liegen, gehört Big Data beim derzeitigen Nobel-Treffen zu den Schwerpunktthemen (vgl. Scholz 2017). Big-Data-Anwendungen sind bspw. auch Teil der Diskussionen beim Digitalgipfel der Bundesregierung (vgl. tagesschau.de 2017). Dementsprechend finden Big Data, Business Analytics und Co. gleichermaßen Anwendung in der Technischen Kommunikation. Einer der Ansätze ist dabei die sogenannte „Content Intelligence“ unter der „Methoden und Technologien zur Messung, Darstellung und Optimierung der CM-Prozesse“ zusammengefasst werden (Ziegler 2012, 41). Grundlage für diese CM-Prozesse ist die kontrollierte, prozesssichere und modulare Wiederverwendung von Inhalten bzw. Content. Dabei können je nach Anwendungsfall und Zielsetzung der Untersuchungen unterschiedliche Schwerpunkte entlang des Lebenszyklus des Contents gesetzt werden, vom ersten Erstellen der Inhalte, über deren Änderung, Verwaltung und Weiterverarbeitung bis hin zur Publikation bzw. anderweitigen Nutzung (vgl. Ziegler 2012, 41).

Das REx-Format

Das sogenannte REx-Format (Report Exchange Format) wurde als Basis für eine Content Intelligence Anwendung entwickelt und zuletzt in der Version 1.2 veröffentlicht (siehe Oberle/Ziegler 2013). Die Strukturdefinition für das REx-Format liegt als XML-Schema vor und wird wie die damit verbundenen Auswertungen kontinuierlich weiterentwickelt.Das XML-basierte Format wird dann ausschließlich durch das Institut für Informations- und Content Management (I4ICM) – einem engen Kooperationspartner der ICMS GmbH – standardisiert ausgewertet. Dabei wird untersucht, wie das jeweilige CMS genutzt bzw. wie effizient damit gearbeitet wird. Zentraler Dreh- und Angelpunkt zur Analyse dieser Arbeitsweise ist die Wiederverwendung der modularen Inhalte im CMS und die damit verbundenen Kennzahlen wie bspw. der Wiederverwendungsgrad (Redundanz) und die Verwendungszahl (Abundanz) (vgl. Ziegler 2012, 21).Die Vorgehensweise von der Datenerhebung bis zur Auswertung ist dabei wie folgt:

  1. Export der REx-XML-Datei über die Schnittstelle des jeweiligen CMS (REx Level 1)
  2. Transformation, Verarbeitung und Anreicherung der REx-XML-Datei durch XSL-Skripte (aus der Datei im REx Level 1 Format wird dabei eine Datei im REx Level 2 Format mit berechneten Kennzahlen)
  3. Transformation der Datei im REx Level 2 Format in den REx-Report mit Dashboard und verschiedenen Diagrammen im HTML-Format
REx Vorgehensweise von der Datenerhebung bis zur Auswertung

Datenerhebung für das REx-Format

Besonders bei Schritt 1 stellt sich die Frage, welche Daten konkret für eine REx-Export-Datei aus dem CMS erhoben und exportiert werden, denn keine Big Data Anwendung und keine Diskussion zu Big Data ohne zu hinterfragen, welche Rolle dabei der Schutz der Daten spielt und wie mit sensiblen Daten umzugehen ist (wie bspw. auch beim oben angesprochenen Digitalgipfel der Bundesregierung (vgl. tagesschau.de 2017)).Prinzipiell werden für den Export in das REx-Format keine Daten erhoben, die nicht für Anwender des jeweiligen CMS über unterschiedliche Such- bzw. Anzeigemechanismen gleichermaßen ersichtlich sind. Besonders bei dem Endergebnis der Auswertungen, dem REx-Report, ist u. a. für wissenschaftliche Studien eine vollständige Anonymisierung erforderlich, weshalb zudem personenbezogene Daten jeglicher Art von den Daten im REx-Export ausgeschlossen sind.Andere Metadaten zu den Inhalten im CMS sind hingegen von Interesse und können je nach CMS auf unterschiedliche Art und Weise exportiert bzw. für den Export konfiguriert werden.Konkret handelt es ich dabei um folgende Daten, die in den nächsten Abschnitten in beispielhaften XML-Auszügen einer REx-Datei dargestellt werden:Neben den Metadaten, die bedeutend für die Interpretation der Kennzahlen sind, aber bereits für den Export aus dem CMS anonymisiert werden können (wer – bzw. welches Unternehmen – setzt welches CMS in welcher Version ein und zu welchem Zeitpunkt wurde der Export erzeugt), steht hier wie groß der Exportumfang ist (die jeweiligen exportierten Dokumenttypen, sind nicht freigegebene Objektversionen enthalten, in welcher Sprache und welchen Medien wurden Objekte exportiert).

REx Metadaten
 Objektmetadaten

Je nach Konfiguration und Implementierung der REx-Schnittstelle im jeweiligen CMS kann zusätzlich eine Übersicht über vorhandene Objektmetadaten und die dafür vorgegebenen Werte exportiert werden (wie bspw. Produkt- und Informationsklassifikation – PI-Klassifikation nach Ziegler).

Export Übersicht über vorhandene Objektmetadaten und die dafür vorgegebenen Werte

Alle weiteren Daten in der REx-Exportdatei beziehen sich auf die Repräsentation einzelner Objekte im CMS und zusätzlicher Informationen zu diesen. Dabei handelt es sich um die ID, Version und Sprache, in der das Objekt vorliegt, sodass eine eindeutige Identifikation des Objekts möglich ist und dieses im CMS wiedergefunden bzw. zurückverfolgt werden kann. Optional können zudem Erstell- und Änderungsdaten, Medieninformationen, sowie weitere Metadaten (wie bspw. PI-Klassifikation nach Ziegler, URL zu Ansicht im Webclient) zu dem jeweiligen Objekt ausgegeben werden.

Metadaten zur eindeutigen Identifikation des Objekts

Bei Objekten, die direkt, d. h. nicht über Referenzierung, eigene (Text-)Inhalte haben wie bspw. Module oder Fragmente, wird zudem die Segmentgröße dieser Inhalte (in der Regel in Wörtern) ausgegeben.

REx Export Segmentgröße
REx Export Grafik

Entscheidend für die Berechnung der Kennzahlen ist wie zuvor erläutert die Wiederverwendung modularer Inhalte, dementsprechend wird für Objekte, die andere Objekte referenzieren bzw. wiederverwenden wie bspw. Dokumente, gekennzeichnet welche Objekte referenziert werden (ID, Sprache und Version dieser Objekte – abgebildet durch reuse-Elemente).

 Angabe der Referenzierungen

Falls im jeweiligen CMS mit automatisierten Filtermechanismen gearbeitet wird, können ebenfalls die Details der Filterprozesse und die entstandenen Varianten analysiert werden.

Fazit

Zusammenfassend lässt sich betonen, dass jegliche personenbezogenen Daten wie bspw. Autorennamen nicht von Interesse für die REx-Auswertungen sind und deshalb nicht im REx-Format vorgesehen bzw. aus Gründen der Anonymisierung davon ausgeschlossen sind. Sämtliche im REx-Format abgebildete Informationen konzentrieren sich auf die Abbildung der im CMS vorhandenen Objekte und deren (Wieder-)Verwendungen. Diese sind je nach CMS auf unterschiedliche Art und Weise implementiert und über diverse Such- und Anzeigefunktionalitäten wie bspw. Verwendungsnachweise für jeden Benutzer des CMS auch ohne REx ersichtlich.Quellen und weiterführende Informationen:

Mehr interessante Artikel:

01/2025
Katrin Schmid - ICMS GmbH
ICMS GmbH ist Teil der conceito Holding GmbH

Neben der conceito GmbH hält die conceito Holding nun auch die Mehrheitsanteile an der ICMS GmbH. Dies ist eine strategische Entscheidung zur Zusammenarbeit, die es uns ermöglicht, Synergien zu schaffen und unser Portfolio zu erweitern. Bereits seit 2019 arbeiten wir mit der conceito GmbH gemeinsam an Kundenprojekten im Bereich Technische Informationen und können unsere Kompetenzen durch die Beteiligung nun optimal bündeln.

weiterlesen →
12/2024
Katrin Schmid - ICMS GmbH
ICMS wünscht Frohe Weihnachten

Das Jahr 2024 geht zu Ende und wir dürfen mit viel Freude und Stolz zurückblicken. Aber wir schauen auch nach vorne - auf neue, spannende und erfolgreiche Projekte. Wir wünschen all unseren Kunden und Partnern ein frohes Weihnachtsfest und ein glückliches, gesundes neues Jahr. Auch dieses Jahr verzichten wir wieder auf Weihnachtsgeschenke an unsere Kunden. Stattdessen spenden wir den Betrag an den Karlsruher Kindertisch e. V. Der gemeinnützige Verein ermöglicht Kindern aus bedürftigen Familien ein warmes Mittagessen in ihren Schulen, KiTas oder anderen pädagogischen Einrichtungen. Wir bedanken uns bei all unseren Kunden und Partnern für die vertrauensvolle Zusammenarbeit und freuen uns auf das Jahr 2025.

weiterlesen →
12/2024
Katrin Schmid - ICMS GmbH
ICMS auf dem Business Festival 2024

Fesselnden Keynotes, interaktive Workshops, spannende Fachvorträge und einmalige Networking-Möglichkeiten. Das alles gab es vom 21.-24. November auf dem @proALPHA BusinessFestival in Duisburg zu erleben. Als Partner von EMPOLIS waren wir vor Ort und präsentierten interessierten Besuchern, wie mit EMPOLIS Informationen der Technischen Redaktion bereichsübergreifend vernetzt werden können. Das proALPHA BusinessFestival ist aber weitaus mehr als nur eine Fachmesse. Wir erlebten eine Verschmelzung aus Innovation, Networking und Wissenstransfer zur Bewältigung individueller Herausforderungen in mittelständischen Unternehmen. Zusammen mit mit einem tollen Rahmenprogramm mit Live-Musik und creative-Spaces in einer atemberaubenden Kulisse war das BusinessFestival ein voller Erfolg.

weiterlesen →
11/2024
Katrin Schmid - ICMS GmbH
Erfolgreiche tekom 2024

Vom 05. bis 07. November 2024 fand im Kongresszentrum Stuttgart die tekom-Jahrestagung statt. Knapp 4000 Besucher aus aller Welt informierten sich vor Ort über die aktuellen Entwicklungen und Zukunftstrends im Bereich der technischen Kommunikation. Auch die Mitarbeitenden der ICMS GmbH nutzten die Chance um sich mit Experten und Kollegen auszutauschen, wertvolle Kontakte zu knüpfen und bei den vielen spannenden Vorträgen einiges an Wissen mit nach Hause zu nehmen.

weiterlesen →
10/2024
Katrin Schmid - ICMS GmbH
tekom 2024 - hier treffen Sie uns

Auch dieses Jahr sind wir wieder mit spannenden Vortägen auf der tekom-Jahrestagung zu Gast. Unsere Referenten Lena Wenner und Stephan Steurer geben interessante Einblicke in die aktuellen Trends mit iiRDS. Lena Wenner und Julia Scheibe zeigen einen praxisnahen Ansatz zur maschinellen Verarbeitung von Wartungsinformationen in iiRDS bei Liebherr.Sie erläutern, wie Bestandsdaten als Grundlage für effiziente, digitale Wartungsprozesse dienen. Dabei gehen sie auf die Herausforderungen und Lösungen ein, die bei der Implementierung solcher Prozesse auftreten können und demonstrieren die Transformation anhand konkreter Beispiele.

weiterlesen →
10/2024
Katrin Schmid - ICMS GmbH
Informativer Austausch auf dem CCTI-Symposium 2024

Das CCTI-Symposium 2024 war das erste seiner Art und gilt trotzdem schon als wichtiger Branchen-Treff im Bereich der Technischen Information. Neben den Vorträgen stellten die Fachdiskussionen an den Thementischen den Schwerpunkt der Veranstaltung dar. In zwei Runden mit jeweils acht unterschiedlichen Themen konnten sich die Teilnehmenden jeweils aussuchen, welches Thema für sie spannend ist, und so direkt Informationen, Meinungen und Erfahrungen mit den Moderatoren und den anderen Teilnehmenden austauschen.

weiterlesen →