Druckversion
Donnerstag, 16.04.2026, 21:52 Uhr


Legal Tribune Online
Schriftgröße: abc | abc | abc
https://www.lto.de//recht/hintergruende/h/legal-data-science-verstaendlich-erklaert-teil-i-was-ist-das-grundlagen-daten-aufbereiten-open-source
Fenster schließen
Artikel drucken
48673

Legal Data Science verständlich erklärt – Teil I: Was ist das?

von Seán Fobbe

08.06.2022

Hund mit Brille sitzt vorm Laptop

Legal Data Science klingt kompliziert, ihr Prinzip ist aber gar nicht so schwierig zu verstehen. Unsere Anleitung, damit es Ihnen besser ergeht als diesem Hund. Foto:Soloviova Liudmyla

Data Science, aber für Jura: Das ist Legal Data Science. Seán Fobbe erklärt in zwei Teilen, was sie ist, wie sie funktioniert und wie man sie sich nützlich machen kann - und zwar verständlich für alle. Heute in Teil I: die Grundlagen.

Anzeige

Legal Tech hat sich in den vergangenen Jahren einen festen Platz im juristischen Diskurs erobert und beflügelt seitdem die Fantasien von Jurist:innen und Politiker:innen gleichermaßen. Big Data, künstliche Intelligenz, Predictive Analytics & Co. sind in aller Munde. Ihre Propheten versprechen die unmittelbar bevorstehende Revolution im Rechtsstaat und die radikale Veränderung des juristischen Alltags. Jahr für Jahr bleibt diese Revolution aber aus. Wieso?

Zunächst die schlechten Nachrichten: Durch mehr Daten werden Ergebnisse nicht unbedingt besser, künstliche Intelligenz ist auch 2022 keine magische Lösung für beliebige Probleme und die von Predictive Analytics versprochene Kristallkugel zeigt meist nur, dass Vorhersagen schwierig sind. Überraschung.

Die gute Nachricht: Hinter dem Hype verbergen sich nützliche Entwicklungen mit viel Potenzial, auch und gerade in unserer juristischen Branche.

Data Science ist ehrlicher als jedes Buzzword

Treten wir daher einen Schritt zurück und blicken zunächst auf die Grundlagen. Big Data, künstliche Intelligenz, Predictive Analytics — all diesen Buzzwords gemeinsam ist eine übergeordnete Disziplin: Data Science. Auch ein Buzzword? Nein, denn Data Science ist einer der ehrlichsten Begriffe aus dem Bereich der neuen Technologien, nennt er doch seine zwei zentralen Elemente direkt im Namen: Data und Science.

Bei Data Science geht es im Kern um das Trennen von relevanten und irrelevanten Informationen ("Data") durch reproduzierbare quantitative Analysen ("Science"). Dieses Prinzip kennen wir im Grunde schon aus der althergebrachten Rechtswissenschaft, nur die Methoden sind dort vorwiegend quantitativ statt qualitativ.

Relevanz ist aber menschengemacht. Wir müssen uns immer klar werden: Welche Frage soll uns Data Science überhaupt beantworten? Interessieren wir uns für eine bestimmte Art von Vertragsklausel, die in einem Bestand von mehreren Tausend aktiven Verträgen überarbeitet werden soll? Wollen wir einen bestimmten Rechtsbegriff in der Rechtsprechung eines Bundesgerichts analysieren? Ist ein Strukturvergleich deutscher Bundesgesetze unser Ziel?

Auch wenn die fortschrittlichste künstliche Intelligenz des Universums "42" für die Antwort auf alle Fragen hält, ist diese Antwort für uns bedeutungslos, wenn die Frage unbekannt oder irrelevant ist. Data Science allein löst keine Probleme, sie generiert stattdessen Wissen, mit dem Menschen Probleme lösen können. Auch hier ist die Verwandtschaft zur Juristerei unverkennbar: Ein juristisches Gutachten kann die Rechtslage darstellen und Handlungsoptionen aufzeigen, die abschließende Entscheidung innerhalb der rechtlichen Rahmenbedingungen müssen aber die Entscheidungsträger in Politik, Wirtschaft und Justiz treffen.

Die Formulierung der Fragestellung erfordert immer eine menschliche Wertung. Deshalb ist eine Automatisierung des gesamten Data-Science-Prozesses (inklusive der Bestimmung des Relevanzkriteriums) ohne die Existenz einer starken künstlichen Intelligenz kaum denkbar. Das Blöde: Von dieser sind wir noch weit entfernt und es ist unklar, ob eine solche überhaupt herstellbar ist. Keine Maschine kann uns (aktuell) diesen Schritt abnehmen. Computer sind auch weiterhin vergleichbar mit dem Geist aus der Flasche: Der Geist erfüllt uns den Wunsch, den wir äußern, ungeachtet der Konsequenzen.

Data Science wird zu Legal Data Science, wenn wir damit entweder juristische Fragestellungen zu beantworten versuchen oder Daten aus juristischen Kontexten analysieren. Wie die traditionelle Dogmatik füllt Legal Data Science zwei Rollen parallel aus: wissenschaftliche Disziplin und pragmatisches Werkzeug für Unternehmen und juristische Praxis.

Es geht um Daten, aber nicht irgendwelche

In Hochglanzbroschüren und auf den Webseiten von Legal-Tech-Unternehmen werden Daten in einen fast mystischen Rang erhoben. Aber worum geht es dabei wirklich?

Daten, so kokettiert die Rechtsdogmatik nichtssagend, sind codierte und codierbare Informationen unabhängig vom Verarbeitungsgrad. Wirtschaftlich geprägte Jurist:innen sprechen bevorzugt von Daten als einem teuren Rohstoff, dem Öl des 21. Jahrhunderts.

Data Scientists nähern sich dem Datenbegriff dagegen zunächst ganz an der Praxis orientiert und teilen ihn in konkrete Typen auf. Darunter sind die besonders bedeutenden tabellarischen Daten (man denke an Excel-Tabellen, daher gerne auch "rechteckige" Daten genannt), Textdaten (z.B. ein Artikel oder ein Urteil), Geodaten (z.B. Koordinaten aller Amtsgerichte in Deutschland), Bilddaten (z.B. unglaublich niedliche Katzenfotos) oder Audiodaten (z.B. ein Lied von Andrea Bocelli), um nur die wichtigsten zu nennen.

Der Typ der Daten ist für die Analyse ganz entscheidend, denn es ist viel einfacher, Katzen in Texten zu finden, als in Bildern oder Tonaufnahmen. Zur maschinellen Aufbereitung und Analyse findet daher im Grunde immer eine Transformation von einem Typ in den anderen statt. Ein klassisches Beispiel mit juristischem Bezug: Aus einem eingescannten Dokument (visuelle Daten) werden mittels optischer Zeichenerkennung maschinenlesbare Texte hergestellt (Textdaten), die auf tabellarische Daten (z.B. eine Matrix) reduziert werden, um sie beispielsweise für Frequenzanalysen zu nutzen. Damit Computer mit Daten rechnen können, steht zwischendrin oder am Ende praktisch immer eine Tabelle, die entweder mathematischen Berechnungen unterworfen wird oder diese zusammenfasst.

Eines ist damit klar: ohne Daten keine Data Science. Wer hätte es gedacht.

Die Qualität und Verfügbarkeit von Daten ist für das Gelingen von Data Science zentral, egal wofür man sie nutzen möchte. Schlechte Daten führen zu schlechten Ergebnissen (auch bekannt als "garbage in, garbage out"). Über diese fundamentale Eigenschaft kann selbst die derzeit beste künstliche Intelligenz nicht hinweghelfen — der wichtigste Grund für Enttäuschungen in diesem Bereich. Üblicherweise rechnet man in einem kompetent organisierten Data-Science-Projekt mit einem sehr hohen Aufwand (ca. 60-80 Prozent der Arbeitskraft) für die Sammlung, Prüfung und Aufbereitung von Daten. In der Industrie hat sich aus diesem Grund das spezialisierte Berufsbild des Data Engineers etabliert — in der Zukunft wird man im juristischen Bereich sicher auch Legal Data Engineers antreffen.

Juristische Daten sind in Deutschland nicht so einfach verfügbar

Damit Legal Data Science nicht ein Werkzeug der Reichen und Mächtigen bleibt, ist Open Legal Data — also die freie Verfügbarkeit von juristischen Daten — für einen gesunden Rechtsstaat, die Zivilgesellschaft, die Wissenschaft und als wirtschaftliche Rahmenbedingung für eine florierende Startup-Szene von ganz zentraler Bedeutung. Die Europäische Union geht hier vorbildlich voran und stellt den gesamten verfügbaren Bestand des EU-Rechts maschinenlesbar und unter freier Lizenz über offene Schnittstellen zur Verfügung. Im deutschen Rechtsstaat ist Open Legal Data hingegen die Ausnahme, nicht die Regel.

Die wichtigsten juristischen Datenbanken (juris, Beck Online) sind fest in privater Hand, berechnen hohe Gebühren für Nutzer:innen und erlauben den Datenzugriff für Konkurrenz und Forschung entweder gar nicht oder nur unter strengen Auflagen, inklusive obligatorischer Geheimhaltungsvereinbarung für wissenschaftliche Projekte. Staatliche Stellen beschränken sich auf das absolute Mindestangebot, welches in dutzende Datenbanken von schwacher Qualität zersplittert ist (etwa die Urteilsdatenbanken der Länder).

Die mehrheitlich in Bundeseigentum stehende juris GmbH nimmt hier eine kuriose Doppelrolle ein: einerseits als privater und klar gewinnorientierter Akteur mit privilegiertem Zugang zu Gerichten und Behörden, andererseits als technischer Dienstleister für öffentliche Datenbanken, die mit dem eigenen privat lizenzierten Angebot in Konkurrenz stehen. Zivilgesellschaftliche Projekte wie openjur.de und openlegaldata.io versuchen, einheitliche und kostenfreie Datenbanken zu schaffen, arbeiten aber mit stark begrenzten Ressourcen und kämpfen mit dem wie gesagt schwierigen Zugang zu juristischen Daten.

Selbst die routinierte Veröffentlichung von Entscheidungen der Bundesgerichte in maschinenlesbaren Formaten erfolgt erst seit dem Jahr 2016 auf der als Ergebnis eines jahrelangen Rechtsstreits eingerichteten Plattform www.rechtsprechung-im-internet.de. Doch auch dieses Angebot umfasst nur einen ganz kleinen, "ausgewählten" Bruchteil der Gerichtsentscheidungen auf Bundesebene, der noch viel geringer ist als das Angebot in den selbstständigen Entscheidungsdatenbanken der Bundesgerichte. Entscheidungen der Gerichte der Länder sind nicht enthalten.

Aktuelle maschinenlesbare Gesetze und Verordnungen können zwar über www.gesetze-im-internet.de abgerufen werden, historische Fassungen werden von der juris GmbH trotz der dominierenden Gesellschafterstellung des Bundes als privates Wirtschaftsgut betrachtet und unter Verschluss gehalten. Von öffentlich finanzierten Wissenschaftler:innen an staatlichen Lehrstühlen erstellte juristische Kommentare und Aufsätze werden praktisch immer an private Akteure verkauft und sind grundsätzlich nur gegen Bezahlung zugänglich.

Ein Hinweis in eigener Sache: Um in dieser verfahrenen Lage das Wachstum der Disziplin Legal Data Science zu fördern, veröffentliche ich seit zwei Jahren aufbereitete, reproduzierbare und urheberrechtsfreie Sammlungen juristischer Daten ("Datensätze"), die über das wissenschaftliche Archiv des Kernforschungsinstituts CERN frei im Internet abrufbar sind. Darunter sind beispielsweise umfangreiche Entscheidungssammlungen für das Bundesverfassungsgericht (BVerfG), den Bundesgerichtshof (BGH), das Bundesverwaltungsgericht (BVerwG), das Bundespatentgericht (BPatG), das Bundesarbeitsgericht (BAG), den Internationalen Gerichtshof (IGH) und den Ständigen Internationalen Gerichtshofs (StIGH). Die vollständige Liste, inklusive Links zum Download, kann unter www.seanfobbe.de/data eingesehen werden.

Da nun in etwa klar sein dürfte, was Legal Data Science ist, kann es im kommenden Teil II um die Anwendung von Legal Data Science gehen. Kleiner Spoiler: Es wird um die Corona-Rechtsprechung des BVerfG gehen – eine heiße Diskussion.

Der Autor Seán Fobbe ist Völkerrechtler und Legal Data Scientist. Er twittert über Menschenrechte, Data Science und den Schutz von Kulturgütern im Irak.

  • Drucken
  • Senden
  • Zitieren
Zitiervorschlag

Legal Data Science verständlich erklärt – Teil I: . In: Legal Tribune Online, 08.06.2022 , https://www.lto.de/persistent/a_id/48673 (abgerufen am: 19.04.2026 )

Infos zum Zitiervorschlag
  • Mehr zum Thema
    • Anwaltsberuf
    • Digitalisierung
    • Justiz
    • Open Source
    • Wissenschaft
Gebäude mit dem Schriftzug "Anwaltskanzlei" 16.04.2026
Anwaltsberuf

BRAK legt Statistik zur Anwaltschaft vor:

Frauen trotzen dem Abwärt­s­t­rend

Der Abwärtstrend bei den Einzelzulassungen von Rechtsanwälten setzt sich auch 2026 fort, wie neue Zahlen der BRAK zeigen. Immerhin: Es gibt in Deutschland nun mehr Anwälte als im Vorjahr – und vor allem mehr Frauen im Anwaltsberuf.

Artikel lesen
August Hanning, der ehemalige Präsident des Bundesnachrichtendienstes in Anzug und Kravatte 15.04.2026
Christina Block

Dienstaufsichtsbeschwerde gegen Ermittler im Block-Prozess:

Ex-BND-Chef Han­ning mit schweren Vor­würfen gegen Ham­burger Justiz

Der Block-Prozess zieht weite Kreise, ermittelt wird sogar mit verdecktem Ermittler gegen einen Ex-BND-Chef. Der zeigt sich empört und hat Dienstaufsichtsbeschwerde gegen Hamburger Justizmitarbeiter eingelegt. Fundiert oder reine PR? 

Artikel lesen
Frau mit digitalem Kalender und Notizblock 13.04.2026
Anwaltsberuf

BGH zu Kanzleisoftware:

Elek­tro­ni­scher Kalender muss Ände­rungen anzeigen

Frist versäumt, weil der elektronische Kalender Änderungen nicht anzeigt? Darin liegt ein Organisationsverschulden des Anwalts, so der BGH. Der Anwalt hätte in diesem Fall Software nutzen müssen, in der geänderte Fristen sichtbar bleiben.

Artikel lesen
Das Bild zeigt den Podcast "Irgendwas mit Recht" und behandelt LinkedIn-Nutzung für Juristen, Networking und Content-Strategien. 13.04.2026
Netzwerk

Jura-Karriere-Podcast:

Wie Juristen Lin­kedIn clever nutzen

Wie finde ich Inhalte für einen Post? Wie vernetze ich mich? Und wie gehe ich mit Gegenwind in der Kommentarspalte um? Darüber und über LinkedIn für Anwälte spricht Karsten Bartels in der aktuellen Folge von Irgendwas mit Recht.

Artikel lesen
Kristallkugel und andere Dinge, die ein:e Wahrsager:in so braucht 12.04.2026
Esoterik

Wahrsagerei in der Rechtsgeschichte:

Als der Blick in die Kri­s­tall­kugel strafbar war

Zwar macht sich sogar die amtliche Statistik womöglich über Hellseherei lustig. Doch ist sie noch freundlich im Vergleich zum juristischen Urteil über esoterische Künste. Das zeigt eine Auswahl zum Verhältnis von Justiz und Wahrsagerei.

Artikel lesen
Marla-Svenja Liebich sitzt mit Schminkutensilien in einem Saal des Landgerichts Halle, Juli 2025 10.04.2026
Strafvollzug

Staatsanwaltschaft Halle äußert sich:

Wie geht es nach der Fest­nahme mit Marla-Svenja Lie­bich weiter?

Nachdem Marla-Svenja Liebich am Donnerstag festgenommen wurde, stellt sich wie vor seiner Flucht die Frage: Wird er seine Haftstrafe im Frauen- oder Männergefängnis verbüßen? Die Staatsanwaltschaft Halle teilt LTO das weitere Prozedere mit.

Artikel lesen
lto karriere logo

LTO Karriere - Deutschlands reichweitenstärkstes Karriere-Portal für Jurist:innen

logo lto karriere
Jetzt registrieren bei LTO Karriere

Finde den Job, den Du verdienst 100% kostenlos registrieren und Vorteile nutzen

  • LTO Job Matching: Finde den Job & Arbeitgeber, der zu Dir passt.
  • Jobs per Mail: Verpasse keine neuen Job-Angebote mehr.
  • Easy Apply: Die einfache und schnelle Bewerbung zu Deinem neuen Job.
Das Passwort muss mindestens 8 Zeichen lang sein und mindestens einen Großbuchstaben, einen Kleinbuchstaben, eine Zahl und ein Sonderzeichen enthalten (z.B. #?!@$%^&*-).
Pflichtfeld *

Nur noch ein Klick!

Wir haben Dir eine E-Mail gesendet. Bitte klicke auf den Bestätigungslink in dieser E-Mail, um Deine Anmeldung abzuschließen.

Weitere Infos & Updates einfach und kostenlos direkt ins Postfach.

LTO Karriere Newsletter

Das monatliche Update mit aktuellen Stellenangeboten & Karriere-Tipps.

LTO Daily

Jeden Abend um 18 Uhr die wichtigsten News vom Tag.

LTO Presseschau

Jeden Morgen um 7:30 Uhr die aktuelle Berichterstattung über Recht und Justiz.

Pflichtfeld *

Fertig!

Um die kostenlosen Nachrichten zu beziehen, wechsle bitte nochmal in Dein Postfach und bestätige Deine Anmeldung mit dem Bestätigungslink.

Du willst Dein Bewerberprofil direkt anlegen?

Los geht´s!
ads lto paragraph
lto karriere logo
ads career people

Wir haben die Top-Jobs für Jurist:innen

Jetzt registrieren
logo lto karriere
TopJOBS
Logo von Taylor Wessing
Re­fe­ren­dar (w/m/d)

Taylor Wessing, Mün­chen

Logo von Hessisches Ministerium der Justiz und für den Rechtsstaat
Voll­ju­ris­ten (m/w/d) – Ih­re Zu­kunft in der hes­si­schen Jus­tiz

Hessisches Ministerium der Justiz und für den Rechtsstaat, Wies­ba­den

Logo von Hengeler Mueller
Rechts­an­wäl­te (m/w/d) im Be­reich ­E­n­er­gie­recht / Er­neu­er­ba­re En­er­gi­en /...

Hengeler Mueller, Frank­furt am Main

Logo von Wolters Kluwer
Ju­ra­stu­dent für LTO-News­desk / Re­dak­ti­on (m/w/d)

Wolters Kluwer, Hürth und 1 wei­te­re

Logo von Leibniz Universität Hannover
Wis­sen­schaft­li­che Mit­ar­beit (Pro­mo­ti­ons­s­tel­le) auf dem Ge­biet des...

Leibniz Universität Hannover, Han­no­ver

Logo von Freshfields
As­so­cia­te (m/w/x) - Phar­ma, Li­fe Sci­en­ces, Med­Tech

Freshfields, Düs­sel­dorf und 1 wei­te­re

Logo von Taylor Wessing
Re­fe­ren­dar (w/m/d)

Taylor Wessing, Ham­burg

Logo von Freshfields
As­so­cia­te (m/w/x) – in al­len Pra­xis­grup­pen mit Pro­gram­mier­er­fah­rung

Freshfields, Frank­furt am Main

Mehr Stellenanzeigen
logo lto events
Logo von Hengeler Mueller
Workshop: Beyond the obvious – Wahrnehmung verstehen, Perspektiven erweitern

12.05.2026, Frankfurt am Main

Realteilung und Spaltung von mittelständischen Personengesellschaften

27.04.2026

Logo von POELLATH
Vom Hörsaal über das Referendariat in die Kanzlei: Wie der Übergang gelingt

30.04.2026, München

RVG: Anrechnung 2 - Vertiefung

27.04.2026

UpDate: Fristverlängerungsanträge – Berufungsbegründung – aktuelle Rechtsprechung des BGH

27.04.2026

Mehr Events
Copyright © Wolters Kluwer Deutschland GmbH