Frau am Schreibtisch reibt sich die Augen vom vielen Lernen
16.512 Noten ausgewertet

Die Exa­mens­klau­suren ver­langen viel – zu viel?

von Prof. Dr. Jörn Griebel und Prof. Dr. Roland Schimmel2025 M10 25, Lesedauer: 10 Minuten

Von 25 Prüflingen nur ein Top-Kandidat: Jörn Griebel und Roland Schimmel haben die NRW-Examensnoten eines ganzen Jahres analysiert. Sie sind sich sicher: Was wir uns mit diesem staatlichen Prüfungswesen leisten, ist wirklich abenteuerlich.

Jedes Jahr liefert das Bonner Bundesamt für Justiz Statistiken zu den überwiegend in staatlicher Verantwortung stehenden Anteilen der Examina. Als Gesamtstatistiken bieten die darin aufgeführten Daten aber nur zusammenfassende Ergebnisse. Die Detaildaten der Justizprüfungsämter, die diese Gesamtergebnisse speisen, bekommt man in aller Regel nicht zu sehen.

Stand jetzt gibt es mit Berlin und Brandenburg nur zwei Bundesländer, die über ihr gemeinsames Justizprüfungsamt die Detailergebnisse der schriftlichen Aufsichtsarbeiten beider Examina der über das Jahr verteilten Termine (Kampagnen) anonymisiert veröffentlichen. Dies schließt Daten zu den Einzelnoten der Prüflinge mit ein. Sich probeweise einmal eine Kampagne (1/2022/II) mit 528 Prüflingen und 3.696 Einzelklausurergebnissen (in Berlin/Brandenburg werden in jedem Termin sieben Aufsichtsarbeiten geschrieben) anzusehen, ergab bereits eine Reihe hochinteressanter Beobachtungen. Vor allem zeigte sich: Nicht einmal die Besten erreichen Bestnoten.

So stellt sich die betrachtenswerte Folgefrage: Wie sieht es in anderen Bundesländern aus? Und verändert sich etwas, wenn man statt einer ausgewählten Kampagne alle Kampagnen eines Jahres auswertet? Hierzu haben die drei Justizprüfungsämter in Nordrhein-Westfalen (NRW) dankenswerterweise die ansonsten unveröffentlichten Daten zur Verfügung gestellt. Diese erfassen anonymisiert die Ergebnisse der neun in NRW 2022 durchgeführten Prüfungstermine in der Ersten Juristischen Prüfung.

Anzeige

2.752 Prüflinge schreiben jeweils sechs Klausuren

Als Datenbasis ist zunächst wichtig: Wie Berlin/Brandenburg liegt NRW ausweislich der Gesamtstatistiken des Bonner Bundesamts für 2022 im Mittelfeld der Benotungen, sodass man die Datensätze als durchaus repräsentativ für die bundesweiten Ergebnisse betrachten kann. Zudem wird in NRW eine bemerkenswert große Kohorte (2022 die größte aller Bundesländer) geprüft, die sich später zumindest in Teilen bundesweit verteilen wird.

Konkret heißt das: Der NRW-Datensatz umfasst 16.512 Einzelnoten von 2.752 Prüflingen (unberücksichtigt blieben 129 Kandidaten, die ausreichend entschuldigt während der Klausuren aus dem Verfahren ausgeschieden sind). Dabei schreiben die Prüflinge in jedem der jährlich neun Termine jeweils sechs Klausuren, je drei im Zivilrecht, zwei im Öffentlichen Recht und eine im Strafrecht – ein beachtliches Zahlenfundament.

Einmal 18 Punkte bei 16.512 Klausuren

Beginnen wir mit einem Blick auf die Notenverteilung. Schon beim "Sehr gut" reiben sich Außenstehende die Augen: In den insgesamt 54 Aufsichtsarbeiten (neun Kampagnen à sechs Klausuren), die 2022 in NRW gestellt wurden, gab es 48-mal die juristische Bestnote (18 Punkte: 1x; 17 Punkte: 11x; 16 Punkte: 36x). Dies entspricht einem Anteil von 0,29 Prozent. Da im Durchschnitt 305,7 Prüflinge an einer Klausur teilgenommen haben, bedeutet dies, dass (gerundet) ein Prüfling von 305 es geschafft hat, in einer seiner sechs Examensklausuren einmal in dieses Notensegment vorzudringen. 

Ergänzt man diese Betrachtung um die Zahl der im Notensegment "gut" erzielten Einzelnoten (15 Punkte: 85x; 14 Punkte: 154x; 13 Punkte: 261x; Anteil an den 16.512 Einzelnoten: 3,18 Prozent), so sind dies 574 Einzelnoten (48 "sehr gut" +526 "gut") bei 54 gestellten Klausuren. Somit schaffen es 10,62 Prüflinge von 305,7, eine "sehr gute" oder "gute" Einzelnote zu erreichen. Statistisch gelingt es damit etwa drei von 100 Prüflingen, wiederum nur einmal dieses Notensegment zu erreichen (das ist eine Quote von 3,4 Prozent).  

Die Wirklichkeit sieht aber anders aus, weil einige besonders leistungsstarke – oder auch: besonders gut "klausuradaptierte" – Kandidaten gleich in mehreren ihrer sechs Aufsichtsarbeiten Spitzennoten erzielen. Die beachtenswerten Leistungen solcher Koryphäen verzerren die statistischen Zahlen damit signifikant. 

Stellt das Examen überhaupt erfüllbare Anforderungen?

Das Gros der Einzelnoten im Spitzensegment liegt bei 13 Punkten (261 Einzelnoten). Das legt die Frage nahe, ob die Klausuren jeweils so angelegt sind, dass Noten im oberen Drittel der Skala (13 bis 18 Punkte) überhaupt erreicht werden können.

Wenn man annimmt, dass es nicht die Aufgabenstellungen als solche sind, die objektiv von vornherein eine Leistung im oberen Drittel unmöglich machen, stellt sich sofort die nächste Frage: Bewerten fast alle Prüfer so streng, dass bessere Ergebnisse statistisch so gut wie ausgeschlossen sind?  

Die Zahlen jedenfalls sprechen bei zahlreichen Klausursachverhalten eher gegen erfüllbare Anforderungen selbst für die besten Prüflinge, also gegen eine generelle "Machbarkeit" der Klausuren. 

Um das zu verdeutlichen: Selbst wenn man die mit "vollbefriedigend" benoteten Klausuren einbezieht (12 Punkte: 453x; 11 Punkte: 609x; 10 Punkte: 735x), hellt sich das Ergebnis nicht wirklich auf. Zusammen mit den Klausurnoten im "sehr gut"- und "gut"-Bereich sind es dann zwar insgesamt 2.371 Einzelnoten von zehn Punkten und aufwärts, die aber immer noch nur einen Gesamtanteil von 14,35 Prozent an den 16.512 Einzelnoten haben. Mit anderen Worten: Nur jede siebte Klausur erzielt ein zweistelliges Ergebnis und liegt damit in der oberen Hälfte der Notenskala. 

Es gibt nicht einen Prüfling mit "sehr gutem" Schnitt

Wenn es für die generelle "Machbarkeit" der Klausuren nun eher düster aussieht, bleibt immer noch die Frage, wie es mit der "Machbarkeit" eines Klausurensatzes aussieht. Denn es wäre ja immerhin denkbar, dass wenigstens einzelne Genies oder auch Prüflinge mit zufällig durchweg exzellenten Klausurtagen bei den Top-Noten richtig abgeräumt und so bewundernswerte Durchschnittsnoten erzielt haben könnten. Solche Fälle würden zeigen, dass eine Kampagne mit sechs Klausuren auf einem hohen Leistungsniveau zu bewältigen war.

Doch auch hinsichtlich dieser Fragestellung fällt die Antwort enttäuschend aus: Es finden sich nämlich keine "sehr guten" Durchschnittsnoten. Auch einen Durchschnitt oberhalb der 15 und der 14 Punkte erreicht keiner der 2.752 Prüflinge. Die beste Durchschnittsnote erzielte ein Kandidat im Freiversuch mit 13,83 Punkten (15, 15, 14, 16, 12 und 11). Zwei weitere Prüflinge (ebenfalls im Freiversuch) erreichten im Schnitt 13,16 Punkte.

Diese drei Kandidaten entsprechen 0,1 Prozent der gesamten Kohorte. Von 2.752 Prüflingen im ganzen Jahr 2022 hat fast kein Prüfling einen Schnitt im oberen Notendrittel erzielt. Es bestätigt sich damit der Eindruck aus der Analyse des Termins in Berlin/Brandenburg: Auch dort wurde keine Durchschnittsnote oberhalb der 13 Punkte erzielt, die beste Durchschnittsnote nur eines Prüflings lag bei 12,14 Punkten.

Arbeitgeber streiten sich um 110 von 2.752 Kandidaten

Von 2.752 Prüflingen haben damit in NRW im Jahr 2022 nur 110 einen zweistelligen Notenschnitt erreicht. Dies entspricht einer Quote von 3,9 Prozent (im Termin in Berlin/Brandenburg waren es 17 von 528 Kandidaten, Quote: 3,2 Prozent). Die anderen rund 96 Prozent der Prüflinge müssen sich mit einem einstelligen Klausurendurchschnitt in der unteren Hälfte der Notenskala begnügen. Es braucht also 25 Prüflinge, um einen Top-Kandidaten hervorzubringen.

Das ist auch deshalb bemerkenswert, weil diese rechnerisch 25 Top-Kandidaten irgendwann einmal mit 25 inzwischen ausgeschiedenen Studienanfängern das Jurastudium aufgenommen haben. Ob es wohl eine volkswirtschaftlich beachtliche Leistung eines Ausbildungssystems ist, wenn Großkanzleien, Justiz und Ministerien sich bei isolierter Betrachtung der Klausuren eigentlich nur um 110 von 2.752 Kandidaten streiten können?

Zum Glück – gerade auch für die Justiz – gibt es neben den Klausuren den mündlichen Prüfungsteil sowie ein einzurechnendes universitäres Schwerpunktstudium, die helfen, die stets sinkenden Einstellungskriterien zu erfüllen.

Zwei Punkte ist die am häufigsten vergebene Note

"Befriedigend" sind dann 3.853 von 16.512 Noten (das entspricht einer Quote von 23,33 Prozent). Dies ist ein sehr kleiner Wert, wenn man bedenkt, dass hier der breite Durchschnitt der Studierenden vertreten sein müsste; man würde eine doppelt so hohe Zahl erwarten dürfen. Addiert man diesen Wert zum Anteil der zweistelligen Einzelnoten (14,35 Prozent plus 23,33 Prozent), erfährt man, dass nur etwas mehr als ein Drittel (37,68 Prozent) aller 16.512 Einzelnoten bei sieben Punkten oder besser liegt. Damit lässt sich schon erahnen, wo das Gros der Einzelnoten verortet ist.

Die Zahl der als schwach bestanden bewerteten Klausuren im Bereich von "ausreichend" liegt bei 5.312 von 16.512 (32,17 Prozent). Neben dieses Drittel tritt dann fast ein weiteres unterhalb der Bestehensschwelle. Bei den mit nicht bestanden bewerteten Leistungen (0 bis 3 Punkte – ungenügend und mangelhaft) sind es 5.247 und damit 31,77 Prozent. Wer hätte übrigens gedacht, dass zwei Punkte die am häufigsten vergebene Note ist (13,47 Prozent aller Klausuren sind so bewertet worden)? Damit gibt es etwa so viele Zwei-Punkte-Klausuren wie 18-, 17-, 16-, 15-, 14-, 13-, 12-, 11- und 10-Punkte Klausuren zusammengerechnet.

Insgesamt sind es fast zwei Drittel der Klausuren, deren Bewertung von den Prüflingen als enttäuschend betrachtet werden muss. Der durchschnittliche Kandidat muss damit rechnen, zwei Klausuren nicht zu bestehen, in zwei weiteren ein enttäuschendes "Ausreichend" und in lediglich zwei weiteren Klausuren ansprechendere Punkte zu erzielen. Man darf sich die Noten dieses Durchschnittskandidaten etwa so vorstellen: 2, 8, 6, 9, 3, 6. Damit wird auch klar, dass die Durchschnittsnote aller 16.512 Einzelnoten mit 5,69 im mittleren "Ausreichend" und damit eine volle Notenstufe beziehungsweise drei Punkte unter der Note "befriedigend" liegt, die für durchschnittliche Leistungen eigentlich vorgesehen ist.

So überrascht es auch nicht, dass mit 1.420 von 2.752 Prüflingen die Zahl der Teilnehmer mit einer ausreichenden Durchschnittsnote fast dreimal so hoch ist wie die derjenigen mit einem "Befriedigend" (551 Kandidaten).

Einzelschicksale an der Bestehensgrenze

Eine Durchschnittsnote unterhalb der Bestehensgrenze erzielten im Übrigen 671 Prüflinge. Manch einer mag zwar eine bessere Durchschnittsnote haben, fällt aber wegen besonderer Mindestleistungsanforderungen trotzdem durch.

So hat zum Beispiel ein Kandidat zwar einen Notendurchschnitt von 5,16 Punkten erreicht, aber die Prüfung nicht bestanden, weil er in den einzelnen Klausuren 3, 3, 3, 8, 11 und 3 Punkte erzielt hat und damit an den Mindestbestehensanforderungen des § 20 I Nr. 1 Juristenausbildungsgesetz NRW (die Hälfte der Klausuren muss bestanden sein) gescheitert ist. Als Wiederholer hat er so endgültig nicht bestanden und muss sich nun ein neues Berufsfeld suchen. Keine Härteklausel, die hier helfen könnte.

Ein anderer Wiederholer hat womöglich nur ein paar Tische weiter gesessen, aber 4, 1, 6, 3, 3 und 4 Punkte geholt, also bestanden, mit einem Klausurdurchschnitt von 3,5 Punkten. Ist das gerecht? Aber wo die Katastrophe wuchert, wächst das Tröstende ganz unversehens auch. Noch ein Wiederholer: 4, 3, 3, 4, 3 und 4 – ein Notendurchschnitt also von 3,5 – schafft die Punktlandung zum Bestehen!

Die Zahlen, die in den Statistiken des Bundesamts für Justiz aufscheinen, sind viel höher aggregiert als die "rohen" Ergebnislisten der Justizprüfungsämter. In Letzteren berichtet jede Tabellenzeile von einem Einzelschicksal – und um die geht es in Prüfungen. Man kann allen an der Reform von Studium und Prüfung Interessierten nur empfehlen, immer mal wieder einen Blick auf eben diese Schicksale zu werfen – herunterladbar etwa hier – und tatsächlich auch mal mit Betroffenen zu sprechen. Sichtweisen verschieben sich ganz schnell, wenn hinter Prüfungsnummern plötzlich Gesichter auftauchen.

Wenn "Ausreichend" zum Durchschnitt wird, haben wir ein Problem

Die hier zusammengetragenen Zahlen sind beachtlich, zumal wenn man bedenkt, dass die Prüflinge – wie angedeutet – nicht zu denen gehören, die das Studium abgebrochen haben, und für ihren Erfolg im Durchschnitt zehn bis elf Semester Lernzeit bei den besten Juristen des Landes und oft genug sogar ergänzend noch sehr guten Repetitorien investiert haben.

Gibt es in irgendeiner anderen Disziplin in Deutschland oder bei Rechtsprüfungen im Ausland Abschlussprüfungen, die auch nur annähernd so schlecht ausfallen wie die Klausuren im schriftlichen Pflichtfachteil der Ersten Juristischen Prüfung? Speziell die Abweichung der faktischen Durchschnittsnoten im ausreichenden Bereich von den durchschnittlichen Anforderungen eines "Befriedigend" – also um eine volle Notenstufe – erscheint problematisch. Wenn Durchschnittsnoten und Bestehensgrenze so nah aneinander liegen (nämlich nur zwei Punkte Abstand), können an schlechten Tagen eigentlich durchschnittliche Kandidaten leicht unter die Bestehensgrenze rutschen. Passiert das womöglich regelmäßig?

Zudem darf eine an der Berufsfreiheit (Art. 12 Abs. 1 Grundgesetz (GG)) zu messende Prüfungsschranke laut dem Bundesverfassungsgericht (BVerfG) nach Art und Höhe "nicht ungeeignet, unnötig oder unzumutbar sein" (BVerfG, Beschl. v. 17.04.1991, Az.: 1 BvR 419/81, 1 BvR 213/83).

Damit wäre wieder die Frage von oben aufgeworfen: Ist womöglich eine abstrakte "Machbarkeit" der Prüfungen zu fordern? Ist der Prüfungsstoff "überfrachtet" und führt daher – prüfungsrechtlich problematisch (Fischer/Jeremias/Dieterich, Prüfungsrecht, 8. Aufl., Rdn. 376) – zu zufälligen Ergebnissen? Sind die einzelnen Klausuren mit Blick auf den zeitlichen Umfang überfrachtet? Oder ist es eine überstrenge Prüferkohorte, die faktisch durchschnittliche Leistungen systematisch als unterdurchschnittlich wertet?

Vieles spricht jedenfalls dafür, dass die anzulegenden testtheoretischen Kriterien insbesondere der Validität und der Reliabilität, die auch die Schranken des Art. 12 Abs. 1 GG nicht ignorieren können, in den juristischen Staatsprüfungen allenfalls mäßig umgesetzt werden. Eine Klausur, die von den Besten nicht mit Bestnote bearbeitet werden kann, scheint gleichermaßen als ungeeignet und unzumutbar. Dies gilt besonders dann, wenn es nicht nur um die Bestehensnote, sondern darum geht, ob man – vielleicht im Letztversuch – überhaupt besteht.

Die Frage der Rechtmäßigkeit stellt sich mit Blick auf einzelne Klausuren, aber auch im Hinblick auf die sechs Aufsichtsarbeiten einer Kampagne in der Gesamtschau. Wäre spannend, wenn sich die mal ein Spezialist aus den Prüfungs- und Testwissenschaften vornähme.

Doch gar nicht die beste Prüfung der Welt

Bereits diese überschaubare Datenauswertung wirft also grundlegende Rechtmäßigkeitsfragen zum schriftlichen Prüfungsteil der Ersten Juristischen Prüfung auf. Es sollte den Justizprüfungsämtern nicht zuletzt aufgrund ihrer Fürsorgepflicht gegenüber den Prüflingen ein Anliegen sein, die Ergebnisse der von ihnen verantworteten Prüfungen kritisch zu betrachten. Die Prüflinge haben einen Anspruch auf eine verlässliche Notengebung nicht nur am oberen, sondern gerade auch am unteren Rand.

Eine strenge und anspruchsvolle Prüfung muss sich selbst an strengen prüfungswissenschaftlichen und grundrechtlichen Standards messen lassen. Hier besteht offenbar ein großes Defizit im Hinblick auf den schriftlichen Prüfungsteil des staatlichen Teils der Ersten Juristischen Prüfung. Vielleicht ist die für viele beste Prüfung der Welt in Wirklichkeit eine der schlechtesten.

Prof. Dr. Jörn Griebel ist Professor für Öffentliches Recht und Internationales Wirtschaftsrecht an der Universität Siegen. Prof. Dr. Roland Schimmel lehrt Wirtschaftsprivatrecht und Bürgerliches Recht an der Frankfurt University of Applied Sciences.

Auf Jobsuche? Besuche jetzt den Stellenmarkt von LTO-Karriere.

Thema:

Staatsexamen

Verwandte Themen:
  • Staatsexamen
  • Jurastudium
  • Prüfungsrecht

Teilen

Aktuelle Jobs

Ähnliche Artikel

Newsletter