Noch muss der Vermittlungsausschuss über die Dokumentation der Hauptverhandlung im Strafprozess entscheiden. Aber wie gut kann eigentlich Software eine Gerichtsverhandlung aufzeichnen? Der Gesetzentwurf schweigt dazu.
Der Widerstand im Bundesrat hat das Gesetz über die Dokumentation der strafrechtlichen Hauptverhandlung in den Vermittlungsausschuss geschickt. Dort soll nun nachverhandelt werden. Dabei ist auch noch die Frage offen, wie überhaupt der Gerichtsprozess im Saal aufgezeichnet werden kann, welche Herausforderungen zu meistern sind und was die Beteiligten am Ende als Ergebnis erwarten dürfen.
Der Gesetzentwurf der Bundesregierung zur Dokumentation der strafrechtlichen Hauptverhandlung, vom Bundestag Mitte November 2023 beschlossen, sieht für erstinstanzliche Verhandlungen vor Oberlandesgerichten und Landgerichten eine Ton-Dokumentation und deren automatische Verschriftlichung vor. Bislang erfordert die Protokollierung eines Strafverfahrens mühsames Mitschreiben, im Protokoll werden nur die wesentlichen Förmlichkeiten festgehalten.
Der Gesetzentwurf lässt die technischen Fragen der Aufzeichnung, er verzichtet "bewusst" darauf "technische und organisatorische Vorgaben im Detail zu machen." Umsetzen dürfen die Länder.
Viele Praktiker treibt offenbar die Angst. Die Angst vor dem irrsinnigen Arbeitsaufwand, den eine mangelhafte Software hervorrufen könnte. Diese Erfahrung machen Richterinnen und Richter gerade bei der Umstellung auf die digitale Akte. Der personelle Mehrbedarf ist in der Justiz schon jetzt durch enorme Dopplungen wie zusätzliches Scannen und mehrfache Eingabe derselben Daten in unterschiedliche Anwendungen deutlich gestiegen.
Wer soll bei Gericht die Transkription auswerten?
Eine weitere Zusatzbelastung kann die Justiz nicht tragen. Dieser droht vor allem dann der Kollaps, sollte die Transkription der Audiodatei den Personalaufwand der Protokollführung verdoppeln. Das steht zu befürchten, wenn die Übertragung von Ton in Schrift bei der Aufzeichnung der Hauptverhandlung anschließend von einem Menschen nachgeprüft und korrigiert werden muss. Der Entwurf geht davon aus, dass es die Technik richten werde. Kontrolle und Korrektur sind nicht vorgesehen. Ob das realistisch ist, wird sich zeigen. Sollte hierfür zusätzlicher Aufwand entstehen, drohten in Strafverfahren wohl häufiger als derzeit Häftlinge aus der Untersuchungshaft entlassen werden. Und einigen Verfahren drohte die Verjährung.
Der Bund ist in der Pflicht, moderne und zuverlässige Software für den Einsatz vorzuschlagen. Sie muss intelligent programmiert und in der Lage sein, so fehlerfreie Verschriftlichungen vorzunehmen, dass die Transkription ohne zusätzlichen Korrekturbedarf den am Verfahren Beteiligten als Arbeitsmittel dienen kann. Diese Aufgabe ist nicht trivial. Es wird nicht ausreichen, die bereits vorhandene Diktiersoftware diverser Anbieter, die eine Sprache-zu-Text-Wandlung vornimmt, einfach noch ein Stückchen weiter zu verbessern. Denn die Aufgabenstellung ist eine andere. Die Hauptverhandlung ist kein Diktat.
Was muss die Software in der Hauptverhandlung leisten können?
Klassische Diktiersoftware wird dazu verwendet, Texte zu verfassen. Ein Text besteht aus sinnhaften Sätzen. Moderne Software orientiert sich daher an dem, was ihr, also der intern arbeitenden KI, als "sinnvoller Satz" beigebracht wurde. Sie achtet insbesondere auf grammatikalische Vollständigkeit und darauf, dass Deklinationen und Konjugationen den Regeln entsprechen. Ob wir als Richter dies tatsächlich so diktiert haben, ist im Zweifel unerheblich. Wir werden es so gemeint haben – wir sollten es so gemeint haben.
Einlassungen von Angeklagten und Aussagen von Zeugen können solch sinnvolle Sätze enthalten. Aber wie oft bestehen Äußerungen aus unvollständigen Satzfetzen, stockend und stotternd, sich selbst unterbrechend, und bisweilen unverständlich endend? Andere wiederum reden ohne Punkt und Komma. Und bisweilen überlagern sich auch Äußerungen, weil diszipliniertes Ausredenlassen zwar eingefordert, aber nicht garantiert werden kann.
Richtiges Deutsch wäre fehlerhaft
Die Herausforderung besteht darin, jede Äußerung so zu Papier zu bringen, dass sie als Wortfolge erscheint, auch wenn diese keinen sinnvollen Satz ergeben sollte. Die einzelnen Worte werden sich nicht immer grammatikalisch richtig verbinden lassen. Eine bloße lautschriftliche Übertragung aneinandergereihter Buchstaben wäre andererseits als Leistung einer Sprache-zu-Text-Wandlung zu wenig, auch wenn sich nicht jeder Ausdruck im Duden finden lassen muss. Dem Fehlerbegriff ist also eine ganz andere Referenz als der Diktier-Software zugrunde zu legen: nicht das Ideal einer korrekten Schriftsprache, sondern das Abbild lebendigen Sprechens in seiner Unvollkommenheit.
Nicht Dialekte oder Idiome stellen insofern die eigentliche Herausforderung dar, sondern die Imperfektion. Auch wenn jedes Individuum selbstredend seine eigene Aussprache pflegt und es daher bislang eines gewissen Anlernens der Software bedarf, um sie zu individualisieren und eine befriedigende Treffgenauigkeit zu erreichen. Eine solche Anlernphase steht für den Software-Einsatz in der Hauptverhandlung aber nicht zur Verfügung. Die bisher zur Einschätzung der Umsetzbarkeit eingeholten Anfragen spezifizieren diese besondere Problemstellung nicht ausreichend. Erste Machbarkeitsstudien laufen zwar, sind aber in ihrer Entwicklung noch nicht an einem einsatzfähigen Punkt. Und in anderen Ländern wird zum Teil auf eine Verschriftlichung verzichtet, zum Teil erfolgt die Übertragung in ein Schriftdokument durch extrem aufwendiges klassisches Abhören.
Das realistische Ergebnis: Kein fehlerfreies Protokoll, aber brauchbare Arbeitsgrundlage
Softwareentwickler können allerdings versuchen, andere Ressourcen zu erschließen. So werden Zeuginnen und Zeugen im Rahmen einer Hauptverhandlung in aller Regel nicht das erste Mal zur Sache vernommen, und vorhergehende polizeiliche Vernehmungen werden bereits jetzt vielfach als Tondokument aufgenommen. Es kann daher, wenn dies gewollt ist, regelmäßig auf ein Sample der individuellen Aussprache eben jenes Vokabulars zurückgegriffen werden, das höchstwahrscheinlich auch in der Einvernahme in der Hauptverhandlung zu hören sein wird. Einschließlich eigenwilliger Orts- und Personennamen, die allzu oft die Phantasie der Software anregen.
Zeitdruck besteht immer. So wäre es ideal, wenn das Transkript nicht erst irgendwann am Tagesende zur Verfügung stünde, sondern wenn dies wie bei einem Diktat mitliefe. Der Gesetzentwurf lässt aber ein Korrekturlesen zu. Warum jedoch muss ein Mensch den Vergleich von Tonspule und Text vornehmen – wenn sich dies automatisieren lässt. Auch eine solche Software müsste aber erst noch entwickelt werden. Bei dieser Gelegenheit kann auch versucht werden, einen weitgehend undifferenzierten Wort-Text-Rausch durch Software in interpunktionsstrukturierte Sätze gliedern zu lassen – eine ganz besondere Herausforderung, da sie den Rückgriff auf Sinn erfordert.
Schließlich wird als Resultat kein fehlerfreies Protokoll angestrebt, sondern lediglich eine brauchbare Arbeitsgrundlage. Auch dieser eingeschränkte Anspruch kann zur Ressource werden. Wenn sie beispielsweise in die Anforderung transformiert wird, den softwareeigenen Wortfindungsprozess ein Stückchen weit offen zu legen. Dann könnten im Text diejenigen Worte oder Phrasen markiert werden, wo sich die Software weniger sicher ist. Und ein Mensch könnte genau dort noch mal Korrektur-lesen-hören. Jedenfalls wissen die Nutzer dann, dass sie an dieser Stelle lieber noch einmal nachhören und/oder nachfragen sollten.
Wobei die Antwort auf eine solche Nachfrage auf eine zusätzliche Option verweist, die die Kontrollsoftware nutzen kann – nämlich eine Kohärenzprüfung. Auch andere softwaretechnische Hilfsmittel, wie beispielsweise Filter zur Bereinigung störender Nebengeräusche und die Entmischung von Sprachdurcheinander, ließen sich einsetzen, um zu verhindern, dass mit der Einführung einer neuen Technik eine weitere Belastung der Justiz einhergeht. Dabei kommt es entscheidend darauf an, von Anfang an eine Software-Architektur zu wählen, die der Komplexität der Aufgabe Rechnung trägt. Erfahrungsgemäß geht jede spätere Erweiterung zu Lasten der Performance, und im schlimmsten Fall leidet die Ausfallsicherheit.
Eine unvorteilhafte Selbstbeschränkung
Der vorliegende Gesetzentwurf beschränkt sich auf eine partielle Neuregelung der Dokumentation der erstinstanzlichen Hauptverhandlung vor den Landgerichten und Oberlandesgerichten. Diese Fokussierung lässt den Gesamtzusammenhang des Regelungsgefüges aus dem Blick geraten. Insbesondere wird den Interdependenzen mit dem erstinstanzlichen Verfahren vor dem Strafrichter und dem Bußgeldrichter bislang nicht die gebotene Aufmerksamkeit geschenkt.
Der Strafrichter darf einerseits nach § 226 Abs.1 StPO von der Hinzuziehung eines Urkundsbeamten absehen und das Protokoll selbst diktieren. Üblich ist diese das Zivilverfahren beherrschende Protokollierungstechnik in Bußgeldverfahren. Andererseits darf er nach § 273 Abs. 2 S.2 StPO anordnen, dass von einzelnen Teilen einer Hauptverhandlung eine Tonaufzeichnung gefertigt wird, wie beispielsweise von den mündlichen Ausführungen eines Sachverständigen. Die Möglichkeit einer umfänglichen Audio-Dokumentation einer Hauptverhandlung vor dem Amtsgericht ist dagegen bislang nicht vorgesehen. Ob ein umfassender Tonmitschnitt unter dem Gesichtspunkt des damit einhergehenden Eingriffs in das Recht der Betroffenen auf informationelle Selbstbestimmung ohne explizite gesetzliche Grundlage zulässig wäre, erscheint zumindest zweifelhaft.
Würde es dem Strafrichter ermöglicht – rechtlich wie technisch – eine protokollersetzende lückenlose Dokumentation der Hauptverhandlung zu fertigen, so würde ihm nicht nur erlaubt, was seinen Kolleginnen am Landgericht vorgeschrieben wäre. Es ließen sich dadurch auch akute Personalengpässe lindern. Es könnte nicht nur der Protokollant gespart werden, der jetzt in jeder Strafverhandlung sitzt, und der noch einmal so viel Zeit aufwenden muss, damit das eilig Mitgetippte auch zu verständlichen Sätzen wird. Soweit Verfahren rechtskräftig abgeschlossen werden, muss ein Tondokument noch nicht einmal abgeschrieben werden. Das ist bereits heute schon so geregelt.
Voraussetzung für einen so weitgehenden technischen Wandel wäre allerdings eine Ergänzung der Ausbildung um den Schwerpunkt der digitalen Verwaltung sowie eine Laufbahn mit einer attraktiven Vergütung. Und eine saubere dogmatische Klärung der Begriffe "Protokoll" und "Dokumentation" in ihren sich teilweise überschneidenden, teilweise ergänzenden Funktionen – und im Kontext der weiteren Umstellung der Justiz auf digitale Medien.
Die Verweisung des Gesetzentwurfes in den Vermittlungsausschuss bietet die Chance, den Entwurf auf beiden Seiten abzurunden: In gesetzestechnischer Hinsicht durch die Einpassung in das dogmatische Gefüge, und in softwaretechnischer Hinsicht durch einen großen Wurf.
Der Autor hat im Unterausschuss Technik der Expertenkommission die Neue Richtervereinigung vertreten. Als Mitglied der richterlichen Personalvertretung begleitet er seit Jahren diverse Projekte der Software-Entwicklung. Dazu gehörte unter anderem die Einführung von Diktiertechnik in der sächsischen Justiz.
Digitalisierung im Gerichtssaal: . In: Legal Tribune Online, 18.01.2024 , https://www.lto.de/persistent/a_id/53663 (abgerufen am: 08.10.2024 )
Infos zum Zitiervorschlag