Screen Scraping
Der Begriff Screen Scraping (engl. Bildschirm abkratzen) umfasst alle Verfahren zum Extrahieren von Informationen aus EDV-Systemen. Dabei bezieht sich das Screen Scraping, wie der Begriff schon andeutet, auf das Auslesen von Bildschirminformationen, die mittels geeigneten Techniken geparsed bzw. extrahiert werden.
Das Screen Scraping ist besonders im Web 2.0 eine wichtige Methode, um Websites auf bestimmte Informationen zu untersuchen und ggf. zu filtern. Dabei werden besonders Websites von Reiseveranstaltern oder Preisvergleich-Portalen mit Datenbanken im Backend als Ziel von Screen-Scraping ausgewählt.
Wie funktioniert Screen Scraping?
Die Entwickler von Screen-Scraping Tools müssen folgende Fragen vorab klären, um ans Ziel zu gelangen:
- Welchen Websites sollen untersucht werden?
- Welche Informationen der Websites sollen untersucht werden?
- Wie sollen die Informationen ausgelesen werden?
- In welchen Intervallen sollen die Websites untersucht werden?
- Wie sollen die ausgelesenen Informationen formatiert werden?
- Wie sollen die Ergebnisse präsentiert werden?
Beim Screen-Scraping werden die Informationen oft mittels Bot oder Spider auf bestimmte Ziel-Websites untersucht und automatisiert ausgelesen. Dabei werden die Daten über bestimmte Methoden, z.B. reguläre Ausdrücke oder Filter-Methoden, extrahiert. Die Informationen werden dann formatiert dem Anfragesteller wiedergegeben.
Einfaches Beispiel für Screen Scraping - leicht & verständlich!
Stellen Sie sich vor, Sie sind ein Mitarbeiter eines lokalen Reisebüros in einer kleinen Stadt mit ca. 500 Reiseveranstaltern. Nun bekommen Sie die Aufgabe von ihrem Chef alle Informationen der Reiseveranstalter zu sammeln und zu analysieren.
Nun müssten sie den kürzesten Weg kalkulieren, um alle 500 Reiseveranstalter abzuarbeiten. Wenn sie nun beim ersten Reiseveranstalter angekommen sind, schauen sie in die Glasscheiben des Reiseveranstalters und notieren alle Reiseangebote, die der Reiseveranstalter anbietet.
Hier setzt das analoge Screen Scraping ein. Sie kratzen zwar keine Informationen aus einem EDV-System ab, sondern notieren alle Informationen, die hinter der Glasscheibe sind. Nach dem Sie alle 500 Reiseveranstalter durchgegangen sind, kehren Sie in das Reisebüro zurück und speichern alle Informationen in einer Datenbank ab. Das Beispiel ist zwar sehr fiktiv, dennoch soll es das Screen Scraping einfach erklären.
Rechtliche Betrachtung zum Screen Scraping
Rechtlich stellt sich die Frage, ob Screen Scraping eher eine Form von Datendiebstahl oder eine zulässige Variante der Nutzung bereitgestellter Information ist. Die deutschen Gerichte stellten zunächst die Tatsache in den Vordergrund, dass sich der Informationssammler auf Kosten der Webseitenbetreiber „bereicherte“.
Nach einer grundsätzlichen Entscheidung, die das Oberlandesgericht Frankfurt im Jahr 2009 traf, wurde immer häufiger darüber nachgedacht, dass die Webseitenbetreiber, die sich über Screen Scraping beklagten, ihre Seiten im Grunde genommen ja dafür eingerichtet haben, um dort enthaltenen Informationen an interessierte Nutzer weiterzugeben.
Nichts anderes geschieht, wenn Inhalte per Screen Scraping auf Sammelseiten transferiert werden. Der entscheidende, einzige Unterschied besteht darin, dass statt eines erhofften, beeinflussbaren Nutzers eine Maschine, der Crawler, auf die angebotenen Informationen zugreift.
Die Gerichte gehen heute davon aus, dass dem Webseitenbetreiber kein Schadensersatzanspruch aus § 823 BGB gegen den automatischen Informationssammler zusteht, wenn nicht nachgewiesen wird, dass die Webseite durch das Screen Scraping in ihrer Funktionsfähigkeit beschädigt worden ist.
Damit entfallen auch wettbewerbsrechtliche Ansprüche, die gemäß § 3a UWG auf Verletzung von § 823 BGB als Vorschrift mit marktregulierenden Auswirkungen gestützt werden könnten. Urheberrechtsschutz gibt es durch § 87b Absatz 1 UrhG nur für den Gesamtinhalt einer Webseite.
Komplette Datenbanken und wesentliche Teile solcher Datenbanken sind urheberrechtlich geschützt, nicht aber einzelne Inhalte. Es würde dem Sinn einer öffentlich freigegebenen Internetseite widersprechen, den Nutzern die Verwendung von dort gefundenen Informationen verweigern zu wollen. Sinn der öffentlichen Datenbank ist ihre Nutzung.
Der Betreiber einer Webseite kann derzeit von den Gerichten in Deutschland wenig Schutz vor Screen Scraping erwarten, solange er nicht nachweist, dass seine Webseite dabei beschädigt worden ist. Gegen das Screen Scraping als Methode, ihm die angestrebte, ungeteilte Aufmerksamkeit der Nutzer zu entziehen, sind Zugangskontrollen erfolgversprechender.
Technische Verfahren, durch die zwischen dem Zugriff einer tatsächlichen Person und dem Zugriff eines Crawlers unterschieden werden kann, helfen dabei. Eine bewährte Methode ist die Zugangskontrolle durch Eingabeerfordernisse, die maschinell nicht programmierbar sind.
Der beste rechtliche Schutz vor Screen Scraping kann dadurch erreicht werden, dass das Herausfiltern und gesonderte Verwenden von Daten in Allgemeinen Geschäftsbedingungen ausgeschlossen wird, die vor dem Beginn einer Nutzung der Webseite ausdrücklich akzeptiert werden müssen. Das Risiko solcher zugangserschwerender Maßnahmen, die auch die persönlichen Nutzer treffen, ist, dass diese sich von der Webseite abwenden.