Forschung & Entwicklung

Forschung bewegt
scientific board
Patente

Algorithmen

Innovation inside

x
XELOPES

XELOPES Bibliothek

x

Die prudsys XELOPES Bibliothek (eXtEnded Library fOr Prudsys Embedded Solutions) ist eine offene, plattform- und datenquellenunabhängige Business-Intelligence-Bibliothek mit dem Schwerpunkt Embedded Data Mining. XELOPES ist CWM-kompatibel, unterstützt die wesentlichen BI-Standards und kann mit allen prudsys-Produkten kombiniert werden.

Anwendungsgebiete

Integration von prudsys-Modellen in Nutzer-Applikationen:Alle Data-Mining-Produkte von prudsys (wie auch von anderen Data-Mining-Anbietern) können ihre Data-Mining-Modelle im PMML-Format als XML-Dateien exportieren. Die XELOPES Bibliothek als Bestandteil Ihrer Applikation erlaubt den Import der PMML-Modelle und deren Anwendung auf neue Daten als Scoring- oder Recommendation Engine.

Integration von Data-Mining-Verfahren in Nutzer-Applikationen:
Die XELOPES Bibliothek stellt leistungsfähige Data-Mining-Algorithmen zur Verfügung, die Sie problemlos in Ihre Applikation integrieren können. Ein umfassendes Konzept erlaubt die Automatisierung der Parameterwahl der Verfahren, um eine vollautomatische Nutzung zu ermöglichen.Integration eigener Data-Mining-Verfahren:Die XELOPES Bibliothek ermöglicht eine schnelle Integration neuer Data-Mining-Verfahren, welche auf das gesamte Framework der Bibliothek, einschließlich der Standards, zugreifen können.

Universalität

Die XELOPES Bibliothek erweitert den "emerging" Common Warehouse Metamodel (CWM) Standard der OMG und stellt zugleich eine seiner ersten Implementierungen dar. Wie dieser ist sie komplett in UML spezifiziert und damit plattformunabhängig. Derzeit sind Implementierungen für Java, C++ und C# sowie CORBA- und Web Service-Schnittstellen verfügbar. Ein universelles Mining Input Stream Konzept erlaubt die Anwendung der Bibliothek auf unterschiedlichste Datenquellen - vom Hauptspeicher über Dateien bis hin zu Datenbanken. Eigene Datenzugriffsklassen können leicht programmiert werden. Somit ist XELOPES komplett Programmiersprachen- und Datenquellen-unabhängig.

Unterstützte Standards

Die XELOPES Bibliothek ist per Konstruktion vollständig kompatibel zum CWM-Standard. Ferner wird das PMML-Datenaustauschformat umfassend unterstützt. Weitere unterstützte BI Standards sind JMI und JOLAP. Es existieren Konnektoren für OLE DB for Data Mining sowie zu verschiedenen populären Data-Mining-Bibliotheken.

Architektur

Die XELOPESBibliothek wurde in voller Übereinstimmung mit  dem Model Driven   Architecture (MDA-) Standard der OMG entwickelt. Der XELOPES-Kern wurde über UML als CWM-Erweiterung definiert und umfassend. Dieser bildet gemäß MDA-Spezifikation das Platform-Independent Model (PIM).

Über Mappings wurden daraus verschiedene Platform- Specific Models (PSM) abgeleitet und implementiert. Derzeit existieren PSMs für Java, C++, C# sowie CORBA und Web Services. Die PSMs sind ebenfalls umfassend dokumentiert.

Die XELOPES-Bibliothek enthält nach dem Baukastensystem Algorithmen aus verschiedenen Bereichen des Business Intelligence, wobei der Schwerpunkt auf Data Mining liegt. Die Algorithmen sind in Paketen angeordnet, aus denen flexibel Bi-Applikationen zusammengebaut werden können.

Datenimport

Über die abstrakte Klasse MiningInputStream werden Datenquellen für Data-Mining-Zugriffe einheitlich modelliert. Es existieren fertige Zugriffsklassen für Speicher, Datenbanken sowie Dateien einschließlich spezieller Formate wie CSV, Excel und Logs. Der Nutzer kann über Erweiterungen der Klasse MiningInputStream eigene Datenzugriffsklassen entwickeln, die speziell auf seine Applikationen zugeschnitten sind.

Analysefunktionen

Die Analysefunktionen der XELOPES-Bibliothek gliedern sich in drei große Pakete: Multidimensional, Data Mining und Reinforcement Learning.
Das Paket Multidimensional enthält multidimensionale Selektionen, Gruppierungen sowie eine komplette OLAP-Engine und ermöglicht somit eine extrem schlanke Implementierung für Datenbankfunktionen und OLAP.
Das Paket Data Mining enthält Statistik mit multidimensionaler Gruppierung, Entscheidungs- und Regressionsbäume, Neuronale Netze, Support Vector Machines, Sparse Grids, Clusterverfahren, Warenkorbanalyse mit Taxonomien und Sequenzanalyse.  prudsys verfügt über die weltweit schnellsten Data-Mining-Verfahren in den Bereichen nichtlineare Regression, Warenkorb- und Sequenzanalyse sowie sequentieller Warenkorbanalyse.
Das Paket Reinforcement Laerning beinhaltet verschiedene Verfahren aus den Bereichen Dynamic Programming und Online Learning. Es nutzt außerdem Modelle aus dem Paket Data Mining für Approximationen. 

Ergebnisse und Export

XELOPES speichert seine Modelle in der CWM-Klasse MiningModel, die in verschiedener Weise serialisiert werden kann. Darüber hinaus können die Modelle in andere Data-Mining-Standards wie PMML exportiert werden.

x
x x x