How-To: Maschinenlesbare Creative Commons-Lizenzen

Drei Schichten der Creative Commons Lizenz. Grafik von creativecommons.org unter CC BY 3.0.

Drei Schichten der Creative Commons Lizenz. Grafik von creativecommons.org unter CC BY 3.0.

Die Creative Commons-Lizenzen haben inzwischen das Web erobert. Alleine der Foto-Dienst Flickr verzeichnete 2011 über 200 Millionen CC-lizensierte Bilder – Tendenz steigend. Theoretisch reicht der einfache Verweis „Lizensiert unter CC-BY-Lizenz“ unter einem Blog-Beitrag oder einem Foto, um Inhalte mit einer „Creative Commons“-Lizenz zu publizieren.

#OERde13
Open Educational Resources
Themenschwerpunkt zur OER-Konferenz 2013 mehr dazu

Jedoch ist diese Angabe meist nicht „maschinenlesbar“ für andere Dienste. In diesem Artikel erfahren Sie, was „maschinenlesbar“ genau bedeutet, warum das Thema wichtig ist und welche Maßnahmen es braucht, um ihre Inhalte im Internet maschinenlesbar unter einer „Creative Commons“-Lizenz zu veröffentlichen.

#pb21-WebTalk: Der Autor dieses Artikels Matthias Andrasch wird zusammen mit Ingo Blees und Richard Heinen von Edutags.de am Montag, 8.7.2013 ab 16.00 Uhr das Thema vorstellen und Fragen beantworten. Details dazu …

Was bedeutet „maschinenlesbar“?

Quelltext
Als Quelltext wird in der Informatik der für Menschen lesbare, in einer Programmiersprache verfasste Text bezeichnet. Hinter jeder Webseite verbirgt sich ein solcher Quelltext, der mit der Auszeichnungssprache „HTML“ (Hypertext Markup Language) verfasst wurde. In Ihrem Web-Browser können Sie im Menü „Ansicht“ meist einen Menüpunkt auswählen, der Ihnen den Quelltext zu der aktuellen Webseite anzeigt.

Als „maschinenlesbar“ werden im Web Informationen bezeichnet, die von Suchmaschinen oder anderen Diensten automatisiert und ohne menschliches Zutun ausgelesen werden können. Diese Informationen werden im Quelltext der Webseite gespeichert. Einfache Beispiele sind z.B. der Titel einer Webseite, der Beschreibungstext oder Schlüsselwörter, die der Seite zugeordnet sind:

<title>How-To: Maschinenlesbare CC-Lizenzen</title>
<meta name="description" content="Dieser Artikel erklärt, wie maschinenlesbare CC-Lizenzen die Reichweite Ihrer Beiträge steigern kann.”>
<meta name="keywords" content="politische bildung,web2.0,pb21”>
Creative Commons Lizenz
Die Non-Profit Organisation Creative Commons stellt vorgefertigte Lizenzverträge bereit, die es einem Urheber ermöglichen anderen Personen die Nutzung von eigenen Inhalten wie Fotos, Videos oder Texten zu erlauben. Eine ausführliche Erläuterung von Creative Commons Lizenzen finden Sie in unserer Artikelreihe „Creative Commons als Urheberrecht 2.0?“

Da diese in einer eindeutigen Schreibweise im Quelltext hinterlegt sind, kann die „Maschine“ diese Daten sinnvoll verarbeiten. Anders verhält es sich mit Texten auf Webseiten, bei denen der Inhalt nicht eindeutig analysierbar ist für die „Maschine“. Menschliche Leser erkennen durch Ihren Hinweis im Text (“Lizenz: CC-BY”), dass es sich um einen CC-lizensierten Beitrag handelt. Für eine Maschine kann diese Information aber verborgen bleiben, da der Hinweis nicht in einer standardisierten Schreibweise im Quelltext hinterlegt ist.

Ein Beispiel: Ein Mensch kann sehr wohl zwischen den drei folgenden Hinweisen auf einer Website unterscheiden, eine Maschine tut sich schwer damit – obwohl überall der Hinweis auf dieselbe Lizenz zu finden ist.
1. Der Text auf dieser Seite steht unter einer CC-BY-Lizenz.
2. Der Text oben steht unter einer CC-BY-Lizenz.
3. Ich bin nicht sicher, ob der Text, den ich für diese Seite übernommen habe, unter einer CC-BY-Lizenz steht.

Wer sind die „lesenden Maschinen“?

Ein Beispiel aus der Praxis: Auf pb21 wurde das Projekt edutags vorgestellt. Mit edutags ist es möglich, Webseiten mit Lehr-Lern-Materialien als Lesezeichen abzulegen und Schlüsselwörter (Tags) zuzuordnen. Klickt der/die Benutzer/in auf „Lesezeichen speichern“ wird ein Import-Skript („die Maschine“) damit beauftragt die eingetragene Seite zu analysieren. Das Skript erstellt dann automatisch ein Bild mit der Voransicht der Webseite. Des Weiteren sucht das Skript nach Informationen im Quelltext, die die Verwendung einer „Creative Commons“-Lizenz angeben. Werden diese gefunden, ergänzt das Skript automatisiert die Schlüsselworter „Creative Commons“. Somit wird neben dem Lesezeichen die jeweilige Lizenz der Ressource angezeigt. Edutags-Nutzer können nun mit einem Blick erkennen, dass es sich um Inhalte unter einer CC-Lizenz handelt ohne die jeweilige Seite besuchen zu müssen.

Ein ähnliches Vorgehen benutzt beispielsweise der Googlebot (Crawler). Dieser durchforstet das Internet für die Suchmaschine Google und analysiert ebenfalls die bereitgestellten Meta-Informationen einer Webseite. In der erweiterten Suche von Googles Webseiten- und Bildersuche können Sie inzwischen auch nach CC-Lizenztypen filtern.

Erweiterte Einstellungen der Web-Suche von Google. Screenshot (fällt nicht unter eine freie Lizenz).

Erweiterte Einstellungen der Web-Suche von Google. Screenshot (fällt nicht unter eine freie Lizenz).

 

Welchen Mehrwert bieten maschinenlesbare Inhalte?

Spätestens seit die Debatte um  „Open Educational Resources“ (OER) in Deutschland angekommen ist, stellt sich die Frage wie man offene Ressourcen effizient kennzeichnet, organisiert und findet. Maschinenlesbare CC-Lizenzen können hierbei einen wichtigen Beitrag leisten und bieten in Kombination mit Diensten, die diese Meta-Informationen effektiv nutzen, einen Mehrwert für Inhaltsproduzent/innen als auch für Inhaltsnutzer/innen.

Mit einer steigenden Verbreitung von „Creative Commons“-Inhalten sowie der flächendeckenden Nutzung einer maschinenlesbaren Lizenzangabe könnten Urheberrechtsprobleme im Internet reduziert werden, da stets klar hinterlegt ist, unter welchen Bedingungen Inhalte genutzt werden können.

Einen weiterer Mehrwert von Maschinenlesbarkeit könnte sich erst in Zukunft zeigen: Die Vision des „Semantic Web“, auch als „Web 3.0“ bezeichnet, wartet weiterhin auf seine Vollendung. Die Grundidee ist, dass in menschlicher Sprache ausgedrückte Informationen mit einer eindeutigen, maschinenlesbaren Beschreibung ihrer Bedeutung versehen werden. So könnten Computer statt reinen Daten ebenfalls Informationen verknüpfen, verarbeiten und inhaltlich in Verbindung bringen. Ein praktisches Beispiel aus dem Wikipedia-Artikel Semantisches Web:

Dresden<Stadt> liegt an der Elbe<Fluss>. Paul Schuster<Familienname> wurde 1950<Geburtsdatum> in Dresden<Geburtsort> geboren.

Bezüglich Creative Commons-Lizenzen gibt es hier schon technische Ansätze, die aufzeigen, wie diese auch im semantischen Web genutzt werden könnten.

Welche Dienste haben CC-Lizenzen bereits integriert?

Multimedia-Dienste wie YouTube, Vimeo, SoundCloud oder Flickr haben inzwischen CC-Lizenzen in ihre Medien-Informationen integriert. Sie können also als Produzent/in von Inhalten mit wenigen Klicks ihr Werk als CC-lizensiert kennzeichnen. Der große Vorteil für Nutzer: Die gezielte Suche nach CC-lizensierten Inhalten ist so einfach wie nie zuvor, da in den erweiterten Suchfunktionen nur der Filter für CC-Lizenzen aktiviert werden muss. Dies bietet das Potenzial die Sichtbarkeit Ihrer Inhalte zu erhöhen.

Mit dem Online-Tool search.creativecommons.org können Sie direkt die Suche nach CC-Inhalten auf den verschiedenen Plattformen ausprobieren:

Online-Dienst „CC Search“. Screenshot (fällt nicht unter eine freie Lizenz).

Online-Dienst „CC Search“. Screenshot (fällt nicht unter eine freie Lizenz).

Wie stelle ich meine CC-lizensierten Inhalte maschinenlesbar bereit?

Was ist aber nun wenn Sie einen eigenen Blog oder eine Webseite betreiben und ihre Inhalte maschinenlesbar unter einen CC-Lizenz veröffentlichen wollen?

Der unkomplizierteste Weg ist die Benutzung des CC-Lizensierungs-Tool, welches auf creativecommons.org bereitgestellt wird. Der HTML-Code, der mit diesem Tool erstellt wird, enthält bereits den maschinenlesbaren Verweis zur jeweiligen Lizenz:

<a href="http://creativecommons.org/licenses/by-nc-nd/3.0/de/" rel="license">Creative Commons</a>

Wenn Sie diesen Code in einem Beitrag einbinden, können die „Maschinen“ von edutags oder Google Ihren Inhalt eindeutig als „Creative Commons“-lizensiert erkennen und dementsprechend markieren.

Eine weitere Möglichkeit ist das Hinzufügen des folgenden Quelltextes in den „head“-Bereich einer Webseite:

<link rel="license" href="//creativecommons.org/licenses/by-sa/3.0/" />

Dieser zeichnet die gesamten Inhalte einer Seite, die den Code im head-Bereich hat, als CC-lizensiert aus. Insofern Sie nur eigene Inhalt und Texte auf ihrem Blog veröffentlichen, die alle unter der gleichen CC-Lizenz stehen sollen, eignet sich dieser vereinfachte Code.

Sie haben nun etwas über den Stellenwert und Verwendungszweck von maschinenlesbaren Creative-Commons-Lizenzen erfahren und kennen die technischen Grundlagen für die Einbindung in Ihre Webseite. Um das Verwenden von maschinenlesbaren Lizenzen zu vereinfachen gibt es jedoch auch zahlreiche kostenfreie Plug-ins. Für das weitverbreitete Blogsystem „Wordpress“ hat pb21 in Teil 2 dieser Artikelreihe die verfügbaren Plug-ins für maschinenlesbare CC-Lizenzen getestet.


Creative Commons Lizenzvertrag Inhalte auf pb21.de stehen i.d.R. unter freier Lizenz (Informationen zur Weiterverwendung).
Der Artikel (Text) auf dieser Seite steht unter der CC BY 3.0 DE Lizenz. Der Name des Autors soll wie folgt genannt werden: Matthias Andrasch für pb21.de.
Urheberrechtliche Angaben zu Bildern / Grafiken finden sich direkt bei den Abbildungen.

Matthias Andrasch studiert derzeit "Medienbildung - Audiovisuelle Kultur und Kommunikation" in Magdeburg. Er greift hierbei auf seine Erfahrung als ausgelernter Fachinformatiker für Anwendungsentwicklung zurück.

Kategorien: Artikel, Bloggen & Twittern, Dienste & Werkzeuge, Schwerpunkt OER Schlagworte: , , , , 3 Kommentare ↓
3 Kommentare zu “How-To: Maschinenlesbare Creative Commons-Lizenzen
  1. veloc1ty sagt:

    Eine kleine Frage zu dem Codeschnipsel im Head-Bereich: Ist es beabsichtigt, dass die URL im href-Attribut ohne http oder www auskommt? Ist die Schreibweise wirklich richtig?

  2. Matthias Andrasch sagt:

    Hallo veloc1ty!

    Die Schreibweise wird genutzt, um das Einbinden auf https:// UND http://-Seiten zu gewährleisten, da sonst der Browser (z.B. Chrome) unter Umständen eine Sicherheitswarnung zeigt.

    Der Youtube-Embed-Code funktioniert auf die gleiche Weise.

    Viele Grüße,
    Matthias Andrasch

  3. veloc1ty sagt:

    Hallo,

    danke für die Antwort. Mit ist so eine Schreibweise nocht nie aufgefallen :-D
    Danke für die Erklärung!

3 Pings/Trackbacks für "How-To: Maschinenlesbare Creative Commons-Lizenzen"
  1. [...] « How-To: Maschinenlesbare Creative Commons-Lizenzen [...]

  2. [...] Im ersten Teil dieser Artikelreihe wurden die technischen Grundlagen von maschinenlesbaren Creative-Commons-Lizenzen erläutert und wieso die Verwendung einen großen Nutzen mit sich bringen kann. Für das häufig genutzte Blogsystem “Wordpress” nimmt pb21 in diesem Artikel nun kostenfreie Plug-ins unter die Lupe, die das komfortable Einbinden von maschinenlesbaren CC-Lizenzen versprechen. Können die Plug-ins ihr Versprechen halten? [...]

  3. [...] Die Creative Commons-Lizenzen haben inzwischen das Web erobert. Alleine der Foto-Dienst Flickr verzeichnete 2011 über 200 Millionen CC-lizensierte Bilder – Tendenz steigend. Theoretisch reicht der einfache Verweis “Lizensiert unter CC-BY-Lizenz” unter einem Blog-Beitrag oder einem Foto, um Inhalte mit einer “Creative Commons”-Lizenz zu publizieren.Jedoch ist diese Angabe meist nicht “maschinenlesbar” für andere Dienste. In diesem Artikel erfahren Sie, was “maschinenlesbar” genau bedeutet, warum das Thema wichtig ist und welche Maßnahmen es braucht, um ihre Inhalte im Internet maschinenlesbar unter einer “Creative Commons”-Lizenz zu veröffentlichen.  [...]

Ihr Kommentar

Die E-Mail-Adresse wird nicht veröffentlicht.

*

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>