Wie Machine Learning die Produktsuche und Suchrelevanz im E-Commerce revolutioniert
Hintergrund:
Die Qualität der Produktsuche ist ein entscheidender Erfolgsfaktor im E-Commerce. Um die Relevanz der Suchergebnisse in der SAP Commerce Cloud zu verbessern, haben wir ein leistungsstarkes Learning-to-Rank (LTR)-Modell in Apache Solr implementiert. Dieses Machine-Learning-Projekt nutzt Metadaten aus Benutzerinteraktionen, die über eine skalierbare Datenpipeline mit Apache Kafka, Confluent und Snowflake verarbeitet werden.
Schritt 1: Erfassung von Metadaten
Der erste Schritt bestand in der systematischen Erhebung relevanter Nutzerdaten aus der SAP Commerce Cloud. Dazu gehörten:
- Suchanfragen der Benutzer
- Klickverhalten und Verweildauer
- Positionierung der Suchergebnisse
- Konversionsmetriken wie Käufe oder Warenkorbaktionen
Diese Daten bildeten die Grundlage für die Optimierung der Suchrelevanz, indem sie wertvolle Einblicke in das Nutzerverhalten ermöglichten.
Schritt 2: Datenpipeline-Integration mit Apache Kafka und Confluent
Um eine effiziente Verarbeitung und Analyse der Daten zu gewährleisten, wurde eine Echtzeit-Datenpipeline implementiert:
- Streaming in Echtzeit: Benutzerinteraktionen wurden unmittelbar von der SAP Commerce Cloud in Kafka-Themen übertragen.
- Datenaufbereitung: Mittels Confluent Stream Processing wurden die Rohdaten bereinigt, normalisiert und mit weiteren Kontextinformationen angereichert.
- Datenanalyse in Snowflake: Die verarbeiteten Daten wurden in Snowflake gespeichert und für das Training des Machine-Learning-Modells aufbereitet.
Schritt 3: Training des LTR-Modell
Das gesammelte Datenmaterial wurde in Snowflake aggregiert und zur Erstellung aussagekräftiger Features genutzt. Anschliessend erfolgte das Training eines LTR-Modells, das die Suchergebnisse basierend auf der Benutzerinteraktion optimierte. Dabei wurden:
- Feature-Vektoren generiert, die Relevanzsignale wie Klickraten und Kaufabsichten widerspiegeln.
- Algorithmen zur Ranking-Optimierung eingesetzt.
- Hyperparameter feinjustiert, um die Modellgenauigkeit zu maximieren.
Schritt 4: Implementierung in Apache Solr
Nach der Validierung wurde das trainierte LTR-Modell in die Apache Solr-Instanz innerhalb der SAP Commerce Cloud integriert:
- Modell-Import: Das Modell wurde ins LTR-Plugin von Solr hochgeladen.
- Feature-Engineering: Benutzerdefinierte Suchfeatures wurden mit den Metadaten aus dem Training verknüpft.
- Relevanzoptimierung: Die Suchergebnisse werden dynamisch anhand prognostizierter Nutzerinteressen gerankt.
Ergebnisse und Nutzen
Durch die Implementierung des LTR-Modells konnten wir die Suchrelevanz und damit die Nutzerzufriedenheit signifikant steigern. Die wichtigsten Ergebnisse:
- Höhere Klickraten und Konversionsraten dank präziserer Produktempfehlungen.
- Verbesserte Auffindbarkeit relevanter Artikel, was zu gesteigertem Umsatz führte.
- Eine automatisierte, skalierbare Lösung für eine kontinuierliche Optimierung der Suchergebnisse.

Fazit
Diese Fallstudie zeigt, wie Machine Learning, Apache Solr und eine robuste Datenpipeline die Produktsuche im E-Commerce transformieren können.
Die Kombination aus Metadaten, Echtzeit-Streaming und intelligenter Ranking-Optimierung bietet Unternehmen, die SAP Commerce Cloud nutzen, einen nachhaltigen Wettbewerbsvorteil.