Umfangreiche Metadaten sichern die Auffindbarkeit und Nachnutzung von Open-Access-Artikeln. Aus diesem Grunde ist die Überprüfung der Metadaten ein wesentlicher Workflow-Bestandteil beim Umgang mit Open-Access-Publikationsgebühren und Transformationsverträgen (Geschuhn & Stone, 2017; Marques et al., 2019).

Der Open-Access-Metadaten-Schnelltest ermöglicht die automatische Überprüfung der Metadatenqualität von Open-Access-Zeitschriftenartikeln. Er richtet sich in erster Linie an Bibliotheken und wissenschaftliche Informationseinrichtungen, die Open-Access-Publikationskosten verwalten.

Im Mittelpunkt der Überprüfung des Open-Access-Metadaten-Schnelltests stehen die Metadaten der DOI-Registrierungsagentur Crossref. Crossref wird von den meisten wissenschaftlichen Verlagen verwendet (Hendricks et al., 2020) und auch im Kontext von Publikationsfonds und Transformationsverträgen werden die meisten DOIs für Open-Access-Artikel über Crossref registriert (Jahn & Tullney, 2016; Pieper & Broschinski, 2018). Crossref-Metadatenservices werden zudem umfangreich in Forschung und Praxis zum Auffinden von Open-Access-Artikeln genutzt, z.B. durch den Open-Access-Discovery-Service Unpaywall (Piwowar et al., 2018), der eine wesentliche Quelle des deutschen Open Access Monitor ist.

Der Open-Access-Metadaten-Schnelltest nutzt Crossref Metadata Plus. Ein Rahmenvertrag sichert einen priorisierten und hochperformanten Zugang zu den Crossref-Schnittstellen.

Bitte beachten Sie, dass der Schnelltest eine Workflowunterstützung bei der Überprüfung von Verlagsmetadaten ist. Der Schnelltest trifft keine abschließenden Aussagen zur Förderfähigkeit von Open-Access-Publikationen bzw. deren Kosten. Dazu sind die Förderbedingungen der jeweiligen Förderer heranzuziehen.

Vorgehen

Der quelloffene Open-Access-Metadaten-Schnelltest erlaubt die umfangreiche Überprüfung von bis zu 1.000 DOIs pro Session und liefert ein Untersuchungsergebnis innerhalb von 45 Minuten per Email. Im Anhang der Ergebnis-Email befindet sich zudem ein umfassender Datenanhang als Exceltabelle.

Vorabprüfung

Vor dem eigentlichen Metadatentest findet eine umfangreiche Vorabprüfung statt. DOIs werden von der weiteren Analyse ausgeschlossen wenn:

  • sie mehrfach vorkommen,
  • sie das Limit von ggw. 1000 DOIs überschreiten,
  • sie beim Link Resolver doi.org nicht bekannt sind,
  • sie nicht von Crossref registriert wurden,
  • für sie keine Metadaten bei Crossref vorliegen oder
  • es sich dabei nicht um einen Zeitschriftenartikel handelt.

Eine ausführliche Erläuterung des Verfahrens befindet sich in der technischen Dokumentation: https://subugoe.github.io/metacheck/reference/pretest.html

Testergebnis

Das Testergebnis umfasst folgende Metadatenkriterien:

Überblick: Crossref-Metadaten

Der Abschnitt zeigt einen tabellarischen Überblick der Überprüfung. Nur Publikationen mit Metadaten in Crossref werden berücksichtigt. Es werden absolute und relative Häufigkeiten dargestellt.

Untersucht wurden:

  • Verfügbarkeit von Creative-Commons-Lizenzen (CC License)
  • Verfügbarkeit von regelkonformen CC-Lizenzen (Compliant CC)
  • Unterstützung von Versionen für das Text- und Data-Mining (TDM) (TDM Support)
  • Verknüpfung zwischen Publikationen und Förderinformationen (Funder info)
  • Verknüpfung zwischen Publikationen und ORCID
  • Unterstützung weitere offener Metadaten (Open Abstracts und Open Citations)

Creative-Commons-Lizenzen

Offene Lizenzen sind wesentlich, um den Zugang und die Nachnutzung von Open-Access-Artikeln unter bestimmten Bedingungen zu regeln. Einschlägig sind die Creative-Commons-Lizenzen (CC-Lizenzen) (siehe Überblick des Bundesministeriums für Bildung und Forschung).

Der Open-Access-Metadaten-Schnelltest normalisiert die Varianten der Creative-Commons-Lizenzen und untersucht, ob Creative-Commons-Lizenzen in den Metadaten regelkonform erfasst sind.

Lizenzbedingungen

Die tabellarische Übersicht zeigt die Häufigkeit von CC-Varianten an. CC-BY ist sowohl in den DEAL-Verträgen als auch beim DFG-Programm Open-Access-Publikationskosten der präferierte Lizenztyp. NA bedeutet, dass keine Lizeninformation in den Crossref-Metadaten verfügbar ist.

Ergebnis Compliance Check

Die Tabelle zeigt die Anzahl und den Anteil regelkonformer CC-Lizenzinformationen laut dem HOAD-Algorithmus. Eine Lizenzinformation ist genau dann regelkonform, wenn

  • es sich um eine Creative-Commons-Standardlizenz handelt,
  • die CC-Lizenz sich auf die Verlagsversion, die sogenannte “version-of-record” bezieht,
  • und die CC-Lizenz mit Erscheinen ohne zeitlichen Verzug gültig ist (Ausschluss von delayed OA)

Wir haben festgestellt, dass Verlage zwar immer häufiger CC-Lizenzen in den Crossref-Metadaten verzeichnen, einige allerdings die Lizenzinformation nur unvollständig beschreiben. Dies kann Auswirkungen auf die automatisierte Auffindbarkeit von Open-Access-Artikeln haben.

Bei Problemen empfehlen wir daher, mit dem Verlag in Kontakt zu treten.

Mehr Hintergrundinformationen zur Überprüfung von Lizenzinformationen in Crossref im Kontext von OA-Transformationsverträgen finden Sie bei Voigt (2020).

Text and Data Mining (TDM)

Der nächste Abschnitt bietet einen Überblick, welche Dateiformate, ausgedrückt als MIME Type, für das Text- und Data-Mining (TDM) unterstützt werden. Grundsätzlich kann je Artikel mehr als ein Format angeboten werden. Wir empfehlen, dass Verlage neben PDF-Dateien auch strukturierte XML-Volltexte verfügbar machen, um die automatisierte Nachnutzung zu erleichtern.

Die prozentualen Anteile in der Tabelle beziehen sich auf alle getesteten Artikel mit Crossref-Metadaten.

Förderinformationen

Es gibt ein großes Interesse, den Förderkontext von Open-Access-Artikeln zu erheben. Einige, aber nicht alle Verlage nutzen Crossref, um den Förderinformationen zu teilen. Der Open-Access-Metadaten-Schnelltest zeigt an, bei wie vielen Artikeln Crossref mindestens eine Forschungsförderung verzeichnet.

Bitte beachten Sie, dass aufgrund der unvollständigen Abdeckung Crossref (noch) nicht geeignet ist für umfangreiche Analysen des Förderkontexts von Publikationen.

Datenanhang

Beigefügt zur Email befindet sich ein Excel-Spreadsheet mit Metadaten auf Artikelebene für weitere Analysen. Es umfasst folgende Datenblätter:

  • cr_overview: Überblick
  • cc_license_check: Detailauswertung Lizenzüberprüfung
  • tdm: Detailauswertung Volltextlinks und TDM
  • funder_info: Förderinformationen lt. Crossref
  • pretest: Ergebnisse der Vorabprüfung

Literatur

Geschuhn, K., & Stone, G. (2017). It’s the workflows, stupid! What is required to make “offsetting” work for the open access transition. Insights the UKSG Journal, 30(3), 103–114. https://doi.org/10.1629/uksg.391

Hendricks, G., Tkaczyk, D., Lin, J., & Feeney, P. (2020). Crossref: The sustainable source of community-owned scholarly metadata. Quantitative Science Studies, 1(1), 414–427. https://doi.org/10.1162/qss_a_00022

Jahn, N., & Tullney, M. (2016). A study of institutional spending on open access publication fees in Germany. PeerJ, 4, e2323. https://doi.org/10.7717/peerj.2323

Marques, M., Woutersen-Windhouwer, S., & Tuuliniemi, A. (2019). Monitoring agreements with open access elements: Why article-level metadata are important. Insights the UKSG Journal, 32. https://doi.org/10.1629/uksg.489

Pieper, D., & Broschinski, C. (2018). OpenAPC: A contribution to a transparent and reproducible monitoring of fee-based open access publishing across institutions and nations. Insights the UKSG Journal, 31. https://doi.org/10.1629/uksg.439

Piwowar, H., Priem, J., Larivière, V., Alperin, J. P., Matthias, L., Norlander, B., Farley, A., West, J., & Haustein, S. (2018). The state of OA: A large-scale analysis of the prevalence and impact of open access articles. PeerJ, 6, e4375. https://doi.org/10.7717/peerj.4375

Voigt, M. (2020). DEAL Open-Access-Option optimal nutzen: Ein Bibliothekspraxisbericht. LIBREAS. Library Ideas, 38. https://libreas.eu/ausgabe38/voigt/