Hintergrund

Umfangreiche Metadaten sichern die Auffindbarkeit und Nachnutzung von Open-Access (OA) Artikeln. Aus diesem Grunde ist die Überprüfung der Metadaten ein wesentlicher Workflow-Bestandteil beim Umgang mit OA-Publikationsgebühren und Transformationsverträgen (Geschuhn & Stone, 2017; Marques et al., 2019).

Der Open-Access-Metadaten-Schnelltest ermöglicht die automatische Überprüfung der Metadatenqualität von OA-Zeitschriftenartikeln. Er richtet sich in erster Linie an Bibliotheken und wissenschaftliche Informationseinrichtungen, die Open-Access-Publikationskosten verwalten.

Im Mittelpunkt der Überprüfung des Open-Access-Metadaten-Schnelltests stehen die Metadaten der DOI-Registrierungsagentur Crossref. Crossref wird von den meisten wissenschaftlichen Verlagen verwendet (Hendricks et al., 2020) und auch im Kontext von Publikationsfonds und Transformationsverträgen werden die meisten DOIs für Open-Access-Artikel über Crossref registriert (Jahn & Tullney, 2016; Pieper & Broschinski, 2018). Crossref-Metadatenservices werden zudem umfangreich in Forschung und Praxis zum Auffinden von Open-Access-Artikeln genutzt, z.B. durch den Open-Access-Discovery-Service Unpaywall (Piwowar et al., 2018), der eine wesentliche Quelle des deutschen Open Access Monitor ist.

Der Open-Access-Metadaten-Schnelltest nutzt Crossref Metadata Plus. Ein Rahmenvertrag sichert einen hochperformanten Zugang zur Crossref REST API.

Mehr Hintergrundinformationen zur Überprüfung von Lizenzinformationen in Crossref im Kontext von OA-Transformationsverträgen finden Sie bei Voigt (2020).

Beispiel

Vorabprüfung

Sie haben 284 DOIs eingegeben.

Zunächst haben wir geprüft, ob zu diesen DOIs konforme Open Access Metadaten vorliegen könnten. DOIs, die eine oder mehrere der folgenden Kriterien nicht erfüllen, werden aus der weiteren Analyse ausgeschlossen.

  • Davon erfüllen 284 (100%) das Kriterium not_missing: DOIs dürfen keine Fehlwerte sein. (0 ausgeschlossen.)
  • Davon erfüllen 284 (100%) das Kriterium unique: DOIs dürfen keine Dubletten enthalten. (0 ausgeschlossen.)
  • Davon erfüllen 284 (100%) das Kriterium within_limits: Anzahl der DOIs muss innerhalb der erlaubten Grenzen liegen. (0 ausgeschlossen.)
  • Davon erfüllen 284 (100%) das Kriterium doi_org_found: DOIs müssen bei DOI.org eine hinterlegte URL haben. (0 ausgeschlossen.)
  • Davon erfüllen 284 (100%) das Kriterium from_cr: DOIs müssen durch Crossref registriert sein. (0 ausgeschlossen.)
  • Davon erfüllen 284 (100%) das Kriterium cr_md: DOIs müssen auf Crossref Metadaten haben. (0 ausgeschlossen.)
  • Davon erfüllen 284 (100%) das Kriterium article: DOIs müssen auf einen Zeitschriftenartikel verweisen. (0 ausgeschlossen.)

Testergebnis

Die folgende Analyse bezieht sich nur auf die verbleibenden 284 DOIs.

Überblick

Die unten stehende Tabelle fasst die Ergebnisse der Überprüfung zusammen.

Artikel Anteil
CC License 284 100%  
Compliant CC 213 75%  
TDM Support 133 47%  
Funder info 188 66%  
ORCID 200 70%  
Open Abstracts 231 81%  
Open Citations 275 97%  

Es werden absolute und relative Häufigkeiten dargestellt.

Untersucht wurden:

  • CC License: Verfügbarkeit von Creative-Commons-Lizenzen (CC)
  • Compliant CC: Verfügbarkeit von regelkonformen CC-Lizenzen
  • TDM Support: Unterstützung von Versionen für das Text- und Data-Mining (TDM)
  • Funder info: Verknüpfung zwischen Publikationen und Förderinformationen
  • ORCID: Open Researcher and Contributor ID der Autor:innen
  • Open Abstracts: Metadaten zu Open Abstracts
  • Open Citations: Metadaten zu Open Citations

Details zu den einzelnen Tests finden Sie im Folgenden.

Creative-Commons Lizenzen

Offene Lizenzen sind wesentlich, um den Zugang und die Nachnutzung von Open-Access-Artikeln unter bestimmten Bedingungen zu regeln. Einschlägig sind die Creative-Commons-Lizenzen (CC-Lizenzen) (siehe Überblick des Bundesministeriums für Bildung und Forschung).

Der Open-Access-Metadaten-Schnelltest normalisiert die Varianten der Creative-Commons-Lizenzen und untersucht, ob Creative-Commons-Lizenzen in den Metadaten regelkonform erfasst sind.

Verwendete CC Lizenzen

Die tabellarische Übersicht zeigt die Häufigkeit von CC-Varianten an.

Artikel Anteil
by 253 89%  
by-nc 25 9%  
by-nc-nd 4 1%  
by-sa 2 1%  

CC-BY ist sowohl in den DEAL-Verträgen als auch beim DFG-Programm Open-Access-Publikationskosten der präferierte Lizenztyp. NA bedeutet, dass keine Lizeninformation in den Crossref-Metadaten verfügbar ist.

Regelkonformität der CC-Lizenzinformation

Die unten stehende Tabelle zeigt die Anzahl und den Anteil regelkonformer CC-Lizenzinformationen.

Artikel Anteil
All fine! 213 75%  
Difference between publication date and the CC license's start_date suggests delayed OA provision 65 23%  
No Creative Commons license metadata found for version of record 6 2%  

Nach diesem Test ist eine Lizenzinformation ist genau dann regelkonform, wenn:

  • es sich um eine Creative-Commons-Standardlizenz handelt,
  • die CC-Lizenz sich auf die Verlagsversion, die sogenannte “version-of-record” bezieht,
  • und die CC-Lizenz mit Erscheinen ohne zeitlichen Verzug gültig ist (Ausschluss von delayed OA).

Wir haben festgestellt, dass Verlage zwar immer häufiger CC-Lizenzen in den Crossref-Metadaten verzeichnen, einige allerdings die Lizenzinformation nur unvollständig beschreiben. Dies kann Auswirkungen auf die automatisierte Auffindbarkeit von Open-Access-Artikeln haben. Bei Problemen empfehlen wir daher, mit dem Verlag in Kontakt zu treten.

Text and Data Mining (TDM)

Die Tabelle bietet einen Überblick, welche (MIME Type) Dateitypen für das Text- und Data-Mining (TDM) unterstützt werden.

Artikel Anteil
application/pdf 130 46%  
application/xml 14 5%  
text/html 115 40%  
text/plain 3 1%  
text/xml 3 1%  
No TDM links for version-of-records 151 53%  

Grundsätzlich kann je Artikel mehr als ein Format über das Crossref-Metadatenprofil angeboten werden. Die prozentualen Anteile können sich daher auf über 100% summieren.

Wir empfehlen, dass Verlage neben PDF-Dateien auch strukturierte XML-Volltexte verfügbar machen, um die automatisierte Nachnutzung zu erleichtern.

Förderinformationen

Es gibt ein großes Interesse, den Förderkontext von Open-Access-Artikeln zu erheben. Verlage nutzen zunehmend Crossref, um Förderinformationen zu veröffentlichen.

Die unten stehende Tabelle zeigt den Anteil der DOIs mit solchen Förderinformationen, sowie die drei unter den getesteten DOIs am häufigsten genannten Förderer.

Artikel Anteil
Deutsche Forschungsgemeinschaft 94 33%  
Technische Universität Berlin 30 11%  
Bundesministerium für Bildung und Forschung 12 4%  
Other funders 100 35%  
No funding info 96 34%  

Erneut können Crossref Metadaten mehr als einen Förderer pro DOI enthalten, so dass Anteile ggfs. auf über 100% addieren.

Bitte beachten Sie, dass aufgrund der unvollständigen Abdeckung Crossref (noch) nicht geeignet ist für umfangreiche Analysen des Förderkontexts von Publikationen.

Literatur

Geschuhn, K., & Stone, G. (2017). It’s the workflows, stupid! What is required to make “offsetting” work for the open access transition. Insights the UKSG Journal, 30(3), 103–114. https://doi.org/10.1629/uksg.391

Hendricks, G., Tkaczyk, D., Lin, J., & Feeney, P. (2020). Crossref: The sustainable source of community-owned scholarly metadata. Quantitative Science Studies, 1(1), 414–427. https://doi.org/10.1162/qss_a_00022

Jahn, N., & Tullney, M. (2016). A study of institutional spending on open access publication fees in Germany. PeerJ, 4, e2323. https://doi.org/10.7717/peerj.2323

Marques, M., Woutersen-Windhouwer, S., & Tuuliniemi, A. (2019). Monitoring agreements with open access elements: Why article-level metadata are important. Insights the UKSG Journal, 32. https://doi.org/10.1629/uksg.489

Pieper, D., & Broschinski, C. (2018). OpenAPC: A contribution to a transparent and reproducible monitoring of fee-based open access publishing across institutions and nations. Insights the UKSG Journal, 31. https://doi.org/10.1629/uksg.439

Piwowar, H., Priem, J., Larivière, V., Alperin, J. P., Matthias, L., Norlander, B., Farley, A., West, J., & Haustein, S. (2018). The state of OA: A large-scale analysis of the prevalence and impact of open access articles. PeerJ, 6, e4375. https://doi.org/10.7717/peerj.4375

Voigt, M. (2020). DEAL Open-Access-Option optimal nutzen: Ein Bibliothekspraxisbericht. LIBREAS. Library Ideas, 38. https://libreas.eu/ausgabe38/voigt/