Automatisierte semantische Analyse regulatorischer Texte

Überblick

Umfang und Komplexität regulatorischer Anforderungen stellen Banken bereits bei deren Analyse vor erhebliche Herausforderungen. Zudem müssen Banken – oft ad-hoc – Anfragen von Regulatoren bearbeiten und sich zeitnah zu Konsultationspapieren äußern.

Verfahren aus den Bereichen NLP und Machine Learning ermöglichen die effektive und effiziente Nutzung vorhandener Wissensressourcen.

Unsere Applikation Regulytics® ermöglicht die automatisierte Analyse regulatorischer sowie interner Texte nach inhaltlichen Gesichtspunkten.
Die App liefert keine umständliche allgemeine Berichte, sondern prägnante, ​​maßgeschneiderte und sofortige Informationen zu inhaltlichen Ähnlichkeiten.
Damit können regulatorisch relevante Texte objektiv in den Gesamtkontext eingeordnet werden. Ähnliche Paragraphen in Regularien und internen Dokumenten können ebenso ermittelt werden wie Unterschiede in verschiedenen Dokument-Versionen.
Finanzdienstleister können einen kostenlosen Test-Account für die Online-Version von Regulytics beantragen.
Zusätzlich bieten wir eine freie Regulytics-Demo-Version zur Analyse der Bauordnungen der verschiedenen deutschen Bundesländer: Link

Regulatorische Herausforderungen

Regularien wie IFRS 9, BCBS 239, FTRB, IRRBB oder die MaRisk-Novelle 2017 erfordern grundlegende Änderungen in Methoden, Prozessen und/oder Systemen der Banken.
Viele Regularien haben weitreichende Auswirkungen auf die Risiken, das Eigenkapital und damit das Geschäftsmodell der betroffenen Banken.
Die große Anzahl der finalen bzw. in Konsultation befindlichen Regularien gestaltet ein Monitoring der Anforderungen und Auswirkungen schwierig.

Die Regularien können verschiedene, miteinander zusammenhängende, Bereiche der Banken, wie Risk, Handel, Finance oder die IT betreffen.
Zudem existieren auch Zusammenhänge zwischen den Regularien; Gaps zu einer Anforderung entsprechen i.d.R. auch Gaps zu weiteren Anforderungen.
Die i.A. unterschiedliche Gesetzgebung in den verschiedenen Jurisdiktionen erhöht die Komplexität nochmals beträchtlich.

Innerhalb der Banken finden Auswirkungsanalysen und Vorstudien statt, um die Relevanz der Projekte einzustufen.
Zahlreiche Beratungsunternehmen führen Vorstudien sowie die eigentlichen Umsetzungsprojekte durch, die sich oft durch lange Laufzeiten und einen hohen Ressourcenbedarf auszeichnen.
Projekte binden interne Ressourcen und verschärfen Personalengpässe.
Externe Unterstützung ist kostspielig und erhöht den Koordinationsaufwand, insb. bei mehreren Dienstleistern.
Fehler in Vorstudien und Projekt-Anfangsphasen lassen sich nur schwer korrigieren.
Aufgrund der hohen Komplexität besteht Risiko, dass Auswirkungen und Interdependenzen nicht rechtzeitig erkannt werden.

Wissensressourcen zur Aufgabenbewältigung

Als externe Ressourcen stehen den Banken zunächst Originaltexte der Regularien sowie der Konsultationen zur Verfügung, die für gewöhnlich frei erhältlich sind. Zahlreiche einschlägige Online-Portale veröffentlichen regelmäßig Artikel über Inhalt und Auswirkungen der regulatorischen Anforderungen. Verschiedene Beratungsunternehmen, insbesondere die Big 4, stellen den Banken außerdem freie Artikel, Whitepapers und Newsletters zur Verfügung. Somit kann dann Internet in gewissem Umfang bereits als Medium für Vorab-Analysen aufgefasst werden.

Intern haben die Banken bereits umfangreiche Erfahrungen durch bereits abgeschlossene oder aktuell laufende Projekte gesammelt, wie Projektdokumentationen oder Lessons Learned. Banken verfügen zusätzlich über umfangreiche Dokumentationen der eingesetzten Methoden, Prozesse und Systeme sowie der Zuständigkeiten und organisatorischen Gegebenheiten. Interne Blogs, etc. bündeln darüber hinaus die Expertise der Mitarbeiter. Teil-Analysen sind damit bereits in beträchtlichem Umfang vorhanden.

Vorteile einer automatisierten Untersuchung

Geschwindigkeitssteigerung

Automatische Analysen können per definitionem sehr schnell und standardisiert durchgeführt werden.
Selbst mit herkömmlichen Laptops können binnen Minuten semantische Ähnlichkeiten in Dutzenden komplexer Regularien analysiert werden.
Damit können – etwa im Falle von Konsultationspapieren – Zuständigkeiten und Auswirkungen rechtzeitig erkannt und in die Stellungnahmen einbezogen werden.

Ressourcenschonung

Unsere Lösung ist – je nach Ausprägung – ohne spezielle Hard- und Software-Anforderungen lauffähig.
Der personelle Aufwand für die Nutzung und ggf. Weiterentwicklung ist äußerst gering und von der Anzahl der betrachteten Regularien weitgehend unabhängig.
Engpässe werden reduziert und Experten können sich auf anspruchsvolle Tätigkeiten fokussieren.
Entsprechend lassen sich Projektkosten reduzieren.

Objektivität

Die Ähnlichkeiten zwischen den Regularien auf Gesamt- und Paragraphen-Ebene liegen quantitativ vor und sind jederzeit reproduzierbar.
Unterschiede durch subjektive Präferenzen sind damit praktisch ausgeschlossen.
Analysen lassen sich nachvollziehbar dokumentieren.
Ergebnisse von Vorstudien und Aussagen externer Dienstleister können unvoreingenommen überprüft werden.

Fehlerreduktion

Automatische Analysen stellen eine effiziente Zusatzkontrolle dar.
Nichttriviale – und möglicherweise übersehene – Interdependenzen zwischen Regularien können identifiziert und berücksichtigt werden.
Insbesondere Flüchtigkeitsfehler sowie das Übersehen ggf. wichtiger Passagen lassen sich damit verringern.
Ggf. unbemerkte Gaps und Impacts können darüber hinaus entdeckt werden.

Wissensnutzung mittels Topic Analysis

Methoden und Tools

Die Verfahren des Natural Language Processing (NLP) im hier verwendeten Sinne ermöglichen semantische Analysen von Texten anhand darin vorkommender Themen (Topics) zur Identifizierung von Ähnlichkeiten bei beliebiger Granularität.
Bei der verwendeten Methode Latent Semantic Analysis (LSA bzw. Latent Semantic Indexing, LSI) erfolgt eine Reduktion der betrachteten Begriffe auf eine vorgegebene Anzahl von Themen und hierdurch eine Abbildung von Texten auf einen „semantischen Raum“.
Die Topic-Ermittlung entspricht dabei einem Unsupervised Learning-Prozess anhand vorgegebener Dokumente.
Neue Texte und Text-Komponenten können anschließend auf semantische Ähnlichkeiten hin untersucht werden.
Die Analysen erfordern Programme auf der Basis entsprechender Analysetools, wie z.B. Python oder R.

Analyse

Zunächst werden die Einheiten bestimmt anhand derer die Texte zu untersuchen sind (Sätze, Paragraphen, usw.) .
Mittels eines „Trainings-Textes“ wird eine Abbildung auf eine vorgegebene Anzahl von Topics ermittelt („Modell“).
Die zu untersuchenden Texte werden ebenfalls mittels des Modells abgebildet und anschließend quantitativ auf Ähnlichkeiten hin untersucht.
Wie rechts skizziert, lässt sich das Verfahren automatisieren und effizient auf eine große Anzahl von Texten anwenden.

Identifizierung ähnlicher Paragraphen

Vorgehen bei der Analyse regulatorisch relevanter Texte

Das Vorgehen für die Analyse auf Gesamt- und Paragraphen-Ebene richtet sich nach den jeweiligen bankfachlichen Zielen. Wir unterstützen Sie bei Detailfragen und bei der Erarbeitung spezifischer Lösungen.

Analyse regulatorisch relevanter Texte

Usecases

Im folgenden werden drei mögliche Analysen regulatorischer Texte skizziert, die sich aufgrund der jeweiligen Zielsetzung unterscheiden. Die Analysen sind problemlos auf interne Texte erweiterbar.

Usecase 1: Identifizierung von Ähnlichkeiten

Bei der Analyse wurden die Regularie Basel II sowie die oft als „Basel IV“ bezeichnete Regularie Basel III: Finalising post-crisis reforms betrachtet.
Bereits der allgemeine Vergleich weist auf eine starke Kosinus-Ähnlichkeit zwischen diesen beiden Texten hin (s. Radar-Diagramm).
Der Matrix-Vergleich über alle Paragraphen liefert eine Übereinstimmung über weite Teile (helle Diagonale, s. Matrix-Diagramm).
Ein Abgleich auf Paragraphen-Ebene liefert zahlreiche fast identische Abschnitte bzgl. Kreditrisiken (s. Tabelle).

Radar-Diagramm auf Gesamt-Ebene
Ähnlichkeitsmatrix auf Paragraphen-Ebene
Ähnliche Paragraphen

Usecase 2: Ermittlung von Unterschieden

Es erfolgte ein Vergleich der deutschsprachigen MaRisk aus den Jahren 2017 und 2012.
Wie anhand des allgemeinen Vergleichs (Radar-Plot) sowie des Matrix-Vergleichs über alle Paragraphen (helle Diagonale) zu sehen, sind die Texte größtenteils identisch.
Unterbrechungen der Hauptdiagonalen (roter Pfeil) weisen jedoch auch auf einige Neuerungen hin.
Ein Ähnlichkeitsvergleich über alle Regularien liefert dabei den Punkt „AT 4.3.4“ als größte Änderung gegenüber MaRisk 2012.

Radar-Diagramm auf Gesamt-Ebene
Ähnlichkeitsmatrix auf Paragraphen-Ebene
“Neuartige” Paragraphen

Usecase 3: Finden ähnlicher Paragraphen

Es wurden die Regularie Basel III: Finalising post-crisis reforms („Basel IV“) sowie Basel III (BCBS 189) betrachtet.
Trotz Unterschiede ist ein Bereich relativ großer Ähnlichkeit auf Paragraphen-Ebene erkennbar (roter Pfeil, unten).
Zur näheren Analyse dieses Bereichs wurde ein entsprechender Paragraph aus Basel IV ausgewählt und hierzu die ähnlichsten Paragraphen aus Basel III ermittelt.
Wie in der Tabelle unten aufgeführt beziehen sich die entsprechenden Paragraphen aus Basel III und IV auf die CVA.

Ähnlichkeitsmatrix auf Paragraphen-Ebene
Ähnliche Ziel-Paragraphen

 

 

 

 

 

 

Angebotsstufen für einen regulatorischen Einsatz von Machine Learning-Verfahren

RiskDataScience ermöglicht Banken die beschriebenen Verfahren effizient und institutsspezifisch einzusetzen und weiterzuentwickeln. Entsprechend den jeweiligen Anforderungen werden dazu folgende drei Ausbaustufen vorgeschlagen.

Stufe 1: Methodik

  • Einweisung in Methodik zum Latent Semantic Indexing regulatorischer Texte
  • Übergabe und Installation der vorhandenen Python-Lösung zum automatisierten Einlesen und Zerlegen von Dokumenten sowie zur semantischen Analyse per LSI
  • Übergabe und Dokumentation der Visualisierungs- und Auswertetechniken

Bank ist in der Lage Methodik zur Analyse regulatorischer Anforderungen eigenständig zu ver-wenden und weiterzuentwickeln

Stufe 2: Customizing

  • Stufe 1 und zusätzlich
  • Anpassung von Analyse-Einheiten (Dokument-Gruppen) gemäß Analysezielen der jeweiligen Bank
  • Analyse der konkreten Regularien, Projekte, Methoden, Prozesse und Systeme zur Identifizierung optimaler Einsatzmöglichkeiten
  • Entwicklung von Prozessen zur Erreichung der Analyseziele
  • Kommunikation und Dokumentation der Ergebnisse an alle Stakeholder

Bank verfügt über gecustomizte Verfahren und Prozesse zur Analyse regulatorischer Anforderungen, etwa bzgl. Zuständigkeiten oder Methoden

Stufe 3: IT-Lösung

  • Stufe 1, Stufe 2 und zusätzlich
  • Spezifikation aller Anforderungen für eine automatisierte, ggf. web-basierte IT-Lösung
  • Vorschlag und Kontaktierung möglicher Anbieter
  • Unterstützung bei der Anbieter- und Tool-Auswahl
  • Unterstützung bei der Planung der Umsetzung
  • Fachliche und koordinative Begleitung des Umsetzungsprojekts
  • Fachlicher Support nach Implementierung der IT-Lösung

Bank verfügt über automatisierte IT-Lösung zum effizienten semantischen Abgleich regulatorisch relevanter Textkomponenten.

Je nach Kundenwunsch ist eine flexible Ausgestaltung möglich. Gerne erläutern wir unseren Ansatz auch im Rahmen eines Vorab-Workshops.

Zudem bieten wir mit Regulytics® eine Web-Applikation zur automatisierten Analyse von Regularien auf Gesamt- und Paragraphen-Ebene.

Kontakt

Dr. Dimitrios Geromichalos
Founder / CEO
RiskDataScience UG (haftungsbeschränkt)
Theresienhöhe 28, 80339 München
E-Mail: riskdatascience@web.de
Telefon: +4989244407277, Fax: +4989244407001
Twitter: @riskdatascience

Machine Learning-basierte Einstufung und Klassifikation regulatorischer Anforderungen

Übersicht Problemstellung und Angebot

Die im Zuge der Finanzkrise ab 2007 beschlossenen Regularien stellen Banken vor kaum zu bewältigende Herausforderungen. Gleichzeitig stehen den Banken beträchtliche Wissensressourcen zur Verfügung, die für die Bewältigung der Aufgaben genutzt werden können, aufgrund ihres Umfangs und ihrer Komplexität jedoch sehr aufwendige Analysen erfordern. Machine Learning-Verfahren ermöglichen die Nutzung der vorhandenen Wissensressourcen mit einer bisher nicht dagewesenen Effizienz und Effektivität.
RiskDataScience verfügt diesbezüglich über bereits entwickelte Kategorien und Algorithmen zur Klassifizierung und Gruppierung von Texten mit regulatorischem Bezug. Der regulatorische Einsatz von Machine Learning-Verfahren kann hierbei flexibel ausgestaltet werden.
Damit können Zusammenhänge zwischen den Regularien erkannt, Stakeholder, Verfahren und Projektabhängigkeiten frühzeitig identifiziert und Probleme antizipiert und vermieden werden. Banken können zudem Projektkosten senken und Planungen optimieren. Außerdem wird eine zeitnahe Einstufung der Auswirkungen erleichtert.

Regulatorische Herausforderungen

Regularien wie IFRS 9, BCBS 239, FTRB, IRRBB oder die MaRisk-Novelle 2016 erfordern grundlegende Änderungen in den Methoden, Prozessen und/oder Systemen der Banken. Viele Regularien haben zudem weitreichende Auswirkungen auf die Risiken, das Eigenkapital und damit das Geschäftsmodell der betroffenen Banken. Die große Anzahl der finalen bzw. in Konsultation befindlichen Regularien gestaltet ein angemessenes Monitoring der Anforderungen und Auswirkungen schwierig.

Weitere Komplikationen ergeben sich aus der Interaktion der Anforderungen. Die Regularien können verschiedene, miteinander zusammenhängende, Bereiche der Banken, wie Risk, Handel, Finance oder die IT betreffen. Bereits laufende Projekte (inklusive der Projektziele) können ebenfalls von Regularien betroffen sein und müssen ggf. angepasst werden. Bei regulatorischen Umsetzungsprojekten kann es daher zu zeitlichen und inhaltlichen Abhängigkeiten sowie Zielkonflikten zwischen den Projekten kommen.

Dementsprechend finden in den Banken unzählige Vorstudien und Umsetzungsprojekte statt. Zahlreiche Beratungsunternehmen führen hierbei Projekte durch, die sich oft durch lange Laufzeiten und einen hohen Ressourcenbedarf auszeichnen. Die Projekte binden außerdem interne Ressourcen und verschärfen bereits vorhandene Personalengpässe.
Generell ist die externe Unterstützung kostspielig und erhöht den Koordinationsaufwand, insbesondere bei mehreren Dienstleistern. Fehler in Vorstudien und Projekt-Anfangsphasen lassen sich zudem nur schwer korrigieren. Aufgrund der hohen Projekt-Komplexität besteht schließlich das Risiko, dass Auswirkungen und Interdependenzen nicht rechtzeitig erkannt werden.

Wissensressourcen zur Aufgabenbewältigung

Als externe Ressourcen stehen den Banken zunächst Originaltexte der Regularien sowie der Konsultationen zur Verfügung, die für gewöhnlich frei erhältlich sind. Zahlreiche einschlägige Online-Portale veröffentlichen regelmäßig Artikel über Inhalt und Auswirkungen der regulatorischen Anforderungen. Verschiedene Beratungsunternehmen, insbesondere die Big 4, stellen den Banken außerdem freie Artikel, Whitepapers und Newsletters zur Verfügung. Somit kann dann Internet in gewissem Umfang bereits als Medium für Vorab-Analysen aufgefasst werden.

Intern haben die Banken bereits umfangreiche Erfahrungen durch bereits abgeschlossene oder aktuell laufende Projekte gesammelt, wie Projektdokumentationen oder Lessons Learned. Banken verfügen zusätzlich über umfangreiche Dokumentationen der eingesetzten Methoden, Prozesse und Systeme sowie der Zuständigkeiten und organisatorischen Gegebenheiten. Interne Blogs, etc. bündeln darüber hinaus die Expertise der Mitarbeiter. Teil-Analysen sind damit bereits in beträchtlichem Umfang vorhanden.

Wissensnutzung durch Machine Learning-Verfahren

Methoden und Tools

Für die Analyse der regulatorischen sowie der sich hierauf beziehenden Texte kommen verschiedene Text Mining-Methoden aus dem Bereich Data Science / Machine Learning in Betracht, die sich in folgende Kategorien einteilen lassen.

  • Supervised Learning: Die Algorithmen werden mit bekannten Datensätzen darauf „trainiert“ Texte den jeweiligen Regularien zuzuordnen. „Unbekannte“ Texte können anschließend bekannten Regularien mit bestimmten Konfidenzen zugeordnet werden. Diese Verfahren eignen sich insbesondere zur Zuordnung neuer Texte zu bereits bekannten Regularien sowie zur Identifizierung von Ähnlichkeits-Kriterien (Stopword-Listen, s.u.).
  • Unsupervised Learning: Hierbei werden „natürliche“ Cluster gebildet, die Regularien können unmittelbar gemäß Ähnlichkeitskriterien gruppiert werden. Neue Regularien können damit mit bereits bekannten verglichen werden.

Die Analysen erfordern Programme auf der Basis entsprechender Analysetools, wie z.B. R oder RapidMiner.

Mining-Vorbereitung

Der erste Schritt ist die Bildung von Ähnlichkeits-Kategorien anhand derer Ähnlichkeiten und Zusammenhänge festgestellt werden sollen. Mögliche Kategorien sind z.B. Risikobezug, Auswirkung auf Kapital, Organisations-Aspekte oder Zielgruppen. Die Bildung der Kategorien sowie der entsprechenden Wortlisten erfordert fundierte fachliche Expertise

Auf Basis der Kategorien sind Wortlisten (bzw. Stopword-Listen, d.h. Ausschlusslisten) zu bilden, anhand derer die Analysen durchgeführt werden sollen. Die eingelesenen und vorverarbeiteten Texte müssen gemäß der zu untersuchenden gefiltert werden.

Mining-Durchführung

Basis für die Mining-Durchführung sind die aus den gefilterten Texten gebildeten Term Document Matrices.
Nach Anpassung der Stopwortlisten können „neue“ Regularien mit bereits bekannten „Backbone-Regularien“ verglichen werden. Die Resultate können dazu verwendet werden die Stopwortlisten weiter zu optimieren und z.B. in Form von Spinnendiagrammen dargestellt werden.
Mit den optimierten Stopwortlisten können anschließend Gruppierungen vorgenommen und in Form von Baumdiagrammen dargestellt werden.

Vorteile einer automatisierten Untersuchung

Kostensenkung

Regulatorische Umsetzungsprojekte sind für Banken einer der größten Kostentreiber. Mit einem Bedarf an mehreren hundert Mitarbeitern können die Kosten im dreistelligen Millionenbereich liegen. Dementsprechend sind die Vorstudien hierzu von großer Bedeutung. Diese beinhalten u.a. die Dokumentklassifikation, Stakeholderermittlung, Relevanzeinstufung, Gap-Analyse und Planung der Umsetzung. Vorstudien sind ihrerseits kostspielig und wirken sich darüber hinaus über die Planung auf die Kosten der Umsetzungsprojekte aus.
Die Kosten automatisierter Analysen sind vergleichsweise marginal. Dennoch können mehrere Aufgaben von Vorstudien, wie die Dokumentklassifikation, die Stakeholderermittlung oder Relevanzeinstufung mit übernommen und optimiert werden.
Damit sinken die Kosten von Vorstudien aufgrund des geringeren Personalbedarfs. Frei werdende Mittel können  effektiver eingesetzt werden, indem z.B. weniger und dafür erfahrene Berater engagiert werden.
Zudem kann die Planung der Umsetzung hinsichtlich möglicherweise irrelevanter Punkte kontrolliert werden.

Fehlerreduktion

Automatische Analysen stellen eine effiziente Zusatzkontrolle dar, die dazu beiträgt Projektrisiken – etwa durch Planungsfehler – zu minimieren.
Nichttriviale – und möglicherweise übersehene – Interdependenzen zwischen Programmen und Projekten können identifiziert und in der Planung berücksichtigt werden.
Ergebnisse von Vorstudien und Aussagen externer Dienstleister können damit eigenständig überprüft werden.

Antizipation

Banken werden mit ständig neuen Konsultationspapieren konfrontiert, zu denen sie Stellung beziehen müssen. Eine rechtzeitige Analyse aller Aspekte ist kostspielig und fehleranfällig.
Automatische Analysen können hingegen per definitionem sehr schnell und standardisiert durchgeführt werden. Damit können Auswirkungen auf das Geschäftsmodell rechtzeitig antizipiert und in die Stellungnahmen einbezogen werden.

Anwendungsbeispiel: Analyse der neuen MaRisk-Novelle 2016

Das im Folgenden beschriebene Anwendungsbeispiel basiert auf einem bereits entwickelten Prototypen (MVP) und extern verfügbaren Daten. Obwohl auch damit bereits die unten skizzierten Einsichten gewonnen werden können, wird der volle Nutzen erst mit der Analyse zusätzlicher bankinterner Texte erreicht.

Allgemeines

Mit einem RapidMiner-Prototypen wurden Ähnlichkeiten zwischen der MaRisk-Novelle 2016 sowie BCBS 239, FRTB, IRRBB, Prudent Valuation und SA-CCR untersucht.
Die Analysen wurden für die von RiskDataScience entwickelten Ähnlichkeitskategorien „Data“ (Datenbezug), „Function“ (Bank-Einheiten), Impact (Auswirkungen auf Projekte und Eigenkapital), Overall (allgemein), Regul (Regulatoren und Zielgruppen) und Risk (Risikoarten und Methoden) durchgeführt.
Die dargestellten Tagclouds geben einen exemplarischen Überblick über den Inhalt einiger Textkorpi.

Tagcloud Textkorpus FRTB

 

Tagcloud Textkorpus MaRisk-Novelle 2016

 

Tagcloud Textkorpus BCBS 239

Bereits anhand der Tagclouds ist somit eine starke Ähnlichkeit zwischen der MaRisk-Novelle 2016 und BCBS 239 (im Gegensatz zu FRTB) ersichtlich.

Textklassifikation

Die RapidMiner-Lösung wurde mit Textkorpi zu den Regularien BCBS 239, Prudent Valuation, IFRS 9, FRTB, IRRBB und SA-CCR trainiert.
Die Texte zur MaRisk-Novelle 2016 wurden als „unbekannt“ angenommen und vom trainierten Algorithmus den jeweiligen „bekannten“ Regularien zugeordnet. Die Visualisierung erfolgte mittels Spinnendiagrammen.

Wie erwartet gibt es in allen Bereichen eine starke Ähnlichkeit zwischen der MaRisk-Novelle 2016 und BCBS 239.

Textclustering

Im Rahmen der Validierung der Textklassifikation wurden die Wortlisten für die Ähnlichkeitskategorien soweit optimiert, bis sie für ein Clustering verwendet werden konnten.
Beim Clustering konnten alle betrachteten Regularien zugleich nach Ähnlichkeiten bzgl. der jeweiligen Kategorie gruppiert werden.
Durch Variation der Cluster-Größe im entsprechenden RapidMiner-Algorithmus wurde eine hierarchische Struktur aufgebaut und als Baumdiagramm visualisiert.

Auch hier gibt es starke Ähnlichkeiten zwischen der MaRisk-Novelle 2016 und BCBS 239.  Weitere starke Ähnlichkeiten existieren zwischen FRTB und IRRBB; IFRS 9 nimmt dagegen oft eine Sonderrolle ein.

Self-Organizing Maps (SOM)

Eine weitere Analyse- und Visualisierungsmöglichkeit ergibt sich mittels Self-Organizing Maps. Hierbei werden die Texte gemäß definierter Kategorien in eine aus Sechsecken bestehende Struktur so, eingeordnet, dass ähnliche Texte benachbart sind. Aufgrund der Vielzahl verschiedener Texte und der Komplexität des Problems nehmen Regularien dabei prinzipiell mehrere Felder ein. Die Farbgebung verdeutlicht zudem die „Einzigartigkeit“ verschiedener Texte.

Kategorie “Overall”

 

Kategorie “Functions”

 

Kategorie “Impact”

Wie erwartet stellt die allgemeine Sicht die MaRisk-Novelle 2016 nahe BCBS 239.  In der Funktionen-Sicht ergeben sich zudem Ähnlichkeiten zwischen FRTB, IRRBB und SA-CCR, die alle von Risk-Abteilungen wahrgenommen werden,  während sich in der Impact-Sicht IFRS 9 und FRTB – mit  Auswirkungen auf die Kapitalisierung – ähneln.

Angebotsstufen für einen regulatorischen Einsatz von Machine Learning-Verfahren

RiskDataScience ermöglicht Banken die beschriebenen Verfahren effizient und institutsspezifisch einzusetzen und weiterzuentwickeln. Entsprechend den jeweiligen Anforderungen werden dazu folgende drei Ausbaustufen vorgeschlagen.

Stufe 1: Methodik

  • Einweisung in Klassifikations- und Gruppierungsmethodik regulato-rischer Texte
  • Übergabe und Installation der vorhandenen Lösung zur Tagcloud-Generierung
  • Übergabe und Installation der vorhandenen RapidMiner-Lösung
  • Übergabe und Dokumentation der Visualisierungs- und Auswertetechniken
    Bank ist in der Lage Methodik eigenständig zu verwenden und weiterzuentwickeln

Stufe 2: Customizing

  • Stufe 1 und zusätzlich
  • Anpassung und ggf. Neuerstellung regulatorischer Ähnlichkeitskategorien gemäß Gegebenheiten der jeweiligen Bank
  • Analyse der konkreten Regularien, Projekte, Methoden, Prozesse und Systeme zur Identifizierung optimaler Einsatzmöglichkeiten
  • Entwicklung einer Prozessbeschreibung für einen effizienten Einsatz
  • Kommunikation und Dokumentation der Ergebnisse an alle Stakeholder
    Bank verfügt über gecustomizte Verfahren und Prozesse zur Analyse regulatorischer Anforderungen

Stufe 3: IT-Lösung

  • Stufe 1, Stufe 2 und zusätzlich
  • Spezifikation aller Anforderungen für eine automatisierte, ggf. webbasierte IT-Lösung
  • Vorschlag und Kontaktierung möglicher Anbieter
  • Unterstützung bei der Anbieter- und Tool-Auswahl
  • Unterstützung bei der Planung der Umsetzung
  • Fachliche und koordinative Begleitung des Umsetzungsprojekts
  • Fachlicher Support nach Implementierung der IT-Lösung
    Bank verfügt über automatisierte IT-Lösung zur effizienten Klassifizierung und Gruppierung regulatorisch relevanter Texte

Je nach Kundenwunsch ist eine flexible Ausgestaltung möglich. Gerne erläutern wir unseren Ansatz auch im Rahmen eines Vorab-Workshops.

Kontakt

Dr. Dimitrios Geromichalos
Founder / CEO
RiskDataScience UG (haftungsbeschränkt)
Theresienhöhe 28, 80339 München
E-Mail: riskdatascience@web.de
Telefon: +4989244407277, Fax: +4989244407001
Twitter: @riskdatascience