Data Science-basierte Identifizierung zusammenhängender operationeller Schadensereignisse

(For the English version click here)

Übersicht Problemstellung und Angebot

Operationelle Risiken stellen sowohl für Finanzdienstleister als auch für Industrieunternehmen eine ebenso große wie schwer zu analysierende Bedrohung dar.
Zusammenhänge zwischen verschiedenen OpRisk-Ereignissen können hierbei trotz komplexer Modelle in der Praxis kaum identifiziert werden und tieferliegende Ursachen bleiben oft unerkannt.
Andererseits haben sich Data Science-Verfahren für ähnliche Fragestellungen bereits etabliert und ermöglichen die Untersuchung großer Mengen unterschiedlicher Daten nach Zusammenhängen, etwa im Bereich der Analyse des Kaufverhaltens von Kunden im Onlinehandel.

RiskDataScience hat entsprechende Verfahren auf die Gegebenheiten operationeller Risiken angepasst und verfügt über bereits entwickelte Algorithmen zur Identifizierung von Interdependenzen zwischen operationellen Schäden.
Unternehmen können damit Kausalbeziehungen zwischen Schäden ausfindig machen, wodurch die Suche nach gemeinsamen Ursachen erleichtert wird. Das gesamte angesammelte Wissen kann effizient genutzt werden, um künftige Schäden möglichst zu vermeiden bzw. frühzeitig zu antizipieren.

Operationelle Risiken

Arten

Operationelle Risiken lassen sich je nach Ursache den folgenden Kategorien zuteilen

  • Menschen: z.B. Betrug, mangelnde Kenntnisse, Mitarbeiter-Fluktuation
  • Prozesse: z.B. Transaktionsfehler, Projektrisiken, Reportingfehler, Bewertungsfehler
  • Systeme: z.B. Programmierfehler, Abstürze
  • Externe Ereignisse: z.B. Klagen, Diebstahl, Feuer, Überschwemmungen

Management

Für gewöhnlich werden operationelle Risiken nach Schadensausmaß und Wahrscheinlichkeit kategorisiert. Entsprechend kommen als Managementstrategien infrage:

  • Vermeidung: Bei großen, unnötigen Risiken
  • Versicherung: Bei großen, nötigen Risiken
  • Verminderung: Insb. bei kleineren Risiken mit hoher Eintrittswahrscheinlichkeit
  • Inkaufnahme: Bei Risiken, die zum Geschäftsmodell gehören

Methoden und Problematik

Die Handhabung operationeller Risiken ist insbesondere im Finanzdienstleistungssektor streng geregelt. So müssen Banken nach Basel II/III operationelle Risiken mit Eigenkapital unterlegen. Hierfür gibt es vorgeschriebene Rechenschemata wie den auf pauschalen Faktoren basierenden Standardized Approach (SA) und den Advanced Measurement Approach (AMA). Letzterer basiert auf Verteilungsannahmen und wird künftig durch den SA ersetzt.

Methodisch unterscheidet man bei der Behandlung operationeller Risiken u.a. zwischen

  • Fragebögen und Self-Assessment: Es werden eher qualitativ Wahrscheinlichkeiten und Ausmaße ermittelt
  • Aktuariellen Verfahren: Diese basieren auf Verteilungsannahmen anhand vergangener Schäden
  • Key Risk Indicator-Verfahren: Es werden einfach beobachtbare Maße identifiziert, die zur Frühwarnung dienen
  • Kausale Netzwerke: Wirkzusammenhänge werden mittels Bayes-Statistik abgebildet

Zusammenhänge zwischen und Ursachen von operationeller Risiken können entweder überhaupt nicht oder nur auf sehr komplexe und fehleranfällige Weise ermittelt werden.

Erkennung von Zusammenhängen mittels Data Science-Verfahren

Assoziationsanalyse

Für die Analyse der Zusammenhänge mehrerer unterschiedlicher Ereignisse („Items“) bieten sich Methoden aus dem Gebiet der Assoziationsanalyse („Association Analysis“) an.
Entsprechende Methoden aus dem Bereich der Warenkorbanalyse haben sich bereits seit einigen Jahren etabliert und finden insbesondere im Online-Handel (z.B. Buchvorschläge im Online-Handel), Suchmaschinenvorschlägen oder im Einzelhandel (Produkte in Regalen) Verwendung.
Mittels der Assoziationsanalyse lässt sich das gemeinsame Auftreten unterschiedlicher Ereignissen unmittelbar und ohne Verteilungsannahmen identifizieren.
Die enorme Vielzahl möglicher Schlussfolgerungen lässt sich mittels eigens hierfür entwickelter Maße wie Support, Confidence und Lift effizient und sachgerecht einschränken.
Die Analysen erfordern Programme auf der Basis entsprechender Analysetools, wie z.B. R oder RapidMiner.

Zusätzlich bieten wir eine freie Web-App für einfache Assoziationsanalysen auf der Basis von CSV-Dateien an.

Analyse-Vorbereitung

Zunächst müssen die Schadensdaten in ein für die Analyse brauchbares Format gebracht werden.
Je nach Schadensart sind zudem zeitliche Aggregationen (z.B. auf Tages-, Wochenbasis) vorzunehmen.
Zu häufig vorkommende oder bereits erklärte Schadensarten sind – anhand von Experteneinschätzungen – zu entfernen.

Analyse-Durchführung

Vor dem Analysebeginn sind die Kriterien für die Schlussfolgerungsregeln gemäß Support und Confidence festzulegen. Die Festlegung der Kriterien kann (z.B. bei R) durch Grafiken unterstützt werden.
Anschließend müssen die Schlussfolgerungen von Experten plausibilisiert werden.
Die Schritte sind für alle relevanten zeitlichen Aggregationen zu wiederholen.

Anwendungsbeispiel: Analyse einer fiktiven Schadensdatenbank

Als Anwendungsbeispiel wurde eine fiktive Schadensdatenbank einer Bank für ein gesamtes Jahr konstruiert.
Es lagen insgesamt 23 mögliche Schadensarten vor, darunter z.B. eine Grippewelle, verspätete Reports, falsche Bewertungen, und Klagen wegen Falschberatung. Folgende Annahmen lagen dem Testbeispiel zugrunde:

  • Fehlerhafte Transaktionen sind sehr häufig
  • Mängel bei Outsourcer-Hotline werden bei Anfragen wg. PC-Headcrashes deutlich
  • Reporting-Mitarbeiter fahren meist Auto und sind von Schneesturm betroffen
  • Nach Abstürzen des Bewertungs-Systems kommt es zu Falschbewertungen
  • Diebstähle während Arbeiten nach Brand im Besprechungsraum
  • Personalengpässe bei Lieferanten führen zu gescheiterten Projekten
  • Massive Kundenbeschwerden nach Abgang von Kundenbetreuern

Da die fehlerhaften Transaktionen sehr oft und unzusammenhängend auftraten, wurden sie als erstes entfernt:

Häufigkeit der Schäden

Zunächst wurden – zur Ermittlung der relevanten Support- und Confidence-Maße sämtliche ermittelte Regeln grafisch dargestellt.

Auftragung der Schluss-Regeln auf Tagesbasis

Nach Einschränkung der Confidence auf ein Mindestmaß von 0,6 ergibt die u.g. Liste.

Identifizierte Zusammenhänge auf Tagesbasis

Von den gefundenen Koinzidenzen erweisen sich – nach Plausibilisierung – die grün markierten als valide.

Auf Wochen- und Monatsbasis wurde analog vorgegangen:

Auftragung der Schluss-Regeln auf Wochenbasis

 

Identifizierte Zusammenhänge auf Wochenbasis

 

Mögliche Zusammenhänge auf Monatsbasis

Nach entsprechender Plausibilisierung möglicher kausaler Beziehungen konnten sämtliche bei der Erstellung gebrauchten Annahmen in den Daten identifiziert werden.

Angebotsstufen für einen Einsatz der
Assoziationsanalyse im OpRisk

RiskDataScience ermöglicht Kunden die beschriebenen Verfahren effizient und unternehmensspezifisch einzusetzen und weiterzuentwickeln. Entsprechend den jeweiligen Anforderungen werden dazu folgende drei Ausbaustufen vorgeschlagen.

Stufe 1: Methodik

  • Einweisung in die Methodik der Assoziationsanalyse
  • Übergabe und Installation der vorhandenen Lösungen auf R– und RapidMiner-Basis – bzw. je nach Kundenanforderung Unterstützung der Implementierung vor Ort
  • Übergabe und Dokumentation der Visualisierungs- und Auswertetechniken

Kunde ist in der Lage Methodik eigenständig zu verwenden und weiterzuentwickeln.

Stufe 2: Customizing

  • Stufe 1 und zusätzlich
  • Anpassung und ggf. Neuerstellung von Kriterien zur Regelauswahl gemäß Gegebenheiten des jeweiligen Kunden
  • Analyse der konkreten Risiken, Prozesse und Systeme zur Identifizierung optimaler Einsatzmöglichkeiten
  • Entwicklung einer Prozessbeschreibung für einen effizienten Einsatz
  • Kommunikation und Dokumentation der Ergebnisse an alle Stakeholde

Kunde verfügt über gecustomizte Verfahren und Prozesse zur Analyse operationeller Risiken.

Stufe 3: IT-Lösung

  • Stufe 1, Stufe 2 und zusätzlich
  • Spezifikation aller Anforderungen für eine automatisierte IT-Lösung
  • Vorschlag und Kontaktierung möglicher Anbieter
  • Unterstützung bei der Anbieter- und Tool-Auswahl
  • Unterstützung bei der Planung der Umsetzung
  • Fachliche und koordinative Begleitung des Umsetzungsprojekts
  • Fachlicher Support nach Implementierung der IT-Lösung

Kunde verfügt über automatisierte IT-Lösung zur effizienten Assoziationsanalyse operationeller Risiken.

Je nach Kundenwunsch ist eine flexible Ausgestaltung möglich. Gerne erläutern wir unseren Ansatz auch im Rahmen eines Vorab-Workshops.

Kontakt

Dr. Dimitrios Geromichalos
Founder / CEO
RiskDataScience UG (haftungsbeschränkt)
Theresienhöhe 28, 80339 München
E-Mail: riskdatascience@web.de
Telefon: +4989244407277, Fax: +4989244407001
Twitter: @riskdatascience