RefMod-Miner

A research prototype for process model analysis and reference model mining. This webseite is currently under construction. Thank you for your patience.
Run RefMod-Miner as a Service now!

Clustern von Modellen

Heatmap_unsorted

Heatmap

Grundidee:

Unternehmen arbeiten heutzutage mit einer stetig wachsenden Menge an Geschäftsprozessen welche zur Qualitätssicherung regelmäßig evaluiert werden müssen.
Als Grundlage für diese Evaluation dienen, durch prozessunterstützende Geschäftssoftware (bspw. ERP), generierte Prozessprotokolle.
Die Auswertung dieser Prozessprotokolle mittels Process Mining und anderer Analysetechniken stellt sich als hochgradig komplexe Aufgabe dar, da die zu Grund liegenden Protokolle riesige Mengen heterogener Informationen zu grundverschiedenen Prozessen und Prozessvarianten enthalten.

Dies macht ein Gruppieren, ein „Clustern“, dieser Elemente in thematisch stimmige Untergruppen zum Zwecke einer sinnvollen Analyse der Prozessprotokolle unabdinglich.

Beim Clustern werden allgemein Datenobjekte in Gruppen mit ähnlichen Eigenschaften eingeteilt. Grundsätzlich werden die Methoden des Clusterns in hierarchische, partionierende und dichtbasierte Verfahren aufgeteilt.
Hierarchische Verfahren verbinden Objekte mit geringer Distanz bzw. mit hoher Ähnlichkeit miteinander; ausgehend vom Ansatzpunkt lässt sich diese Methode nochmals in divise (von einem großen Clustern zu vielen kleinen) und agglomerative (kleine Cluster zu größeren Clustern) Algorithmen unterteilen.

Bei partionierenden Verfahren wird zunächst eine konkrete Anzahl an gewünschten Clustern k festgelegt. Im Anschluss werden die Datenobjekte schrittweise zwischen den Clustern hin- und hergeschoben bis sich die Clusterzugehörigkeit nicht mehr verändert.
Dichtbasierte Verfahren betrachten die innere Dichte jedes Clusters und stellen Ähnlichkeiten anhand der Nähe der einzelnen Punkte fest.

 

 

Funktionsweise im RefMod-Miner

Die Gruppierung im RefMod-Miner erfolgt anhand spezifischer Ähnlichkeitsmaße, die die Modelle in thematisch ähnliche Felder einteilt. Dem Benutzer stehen für diesen Vorgang momentan vier verschiedene Algorithmen zur Verfügung, die die verschiedenen Methoden des Clustering abdecken.

PAM (Partioning around medrioids) und KMEANS sind partionierende Verfahren, HCLUST ist ein hierarchisches Mittel (der angewandte Algorithmus kann innerhalb des RefMod-Miners spezifiziert werden) und DBSCAN stellt ein dichtbasiertes Verfahren dar.

Neben der Erstellung des Clustern unterstützt der RefMod-Miner auch ihre nachfolgende Auswertung und Weiterverwendung.

 

Heatmap_sortedbyclusters

Heatmap gruppiert nach Cluster