Konzept

Recall-Pipeline

Eine einzige Recall-Anfrage löst in knowmind drei Suchen parallel aus und fusioniert die Ergebnisse. Diese Seite beschreibt die Stufen, ihre Auswahl-Kriterien und die Reihenfolge.

Worum es geht

Eine reine Volltext-Suche findet wortwörtliche Treffer, geht aber an paraphrasierten Inhalten vorbei. Eine reine Vektor-Suche findet Paraphrasen, neigt aber zu thematisch ähnlichen, faktisch falschen Treffern. Ein Wissensgraph findet eng verwandte Entitäten, ohne sie inhaltlich gesehen zu haben. knowmind kombiniert alle drei und rankt das Ergebnis mit einem Cross-Encoder neu — robuster als jedes einzelne Verfahren.

Die Stufen

Eine Recall-Anfrage löst fünf Suchen parallel aus. RRF fusioniert die Ranglisten, der Cross-Encoder rerankt das Top-Feld.
  1. BM25 (Volltext): PostgreSQL-Volltext-Index mit tenant-spezifischer Sprachkonfiguration (Standard: deutsch). Findet wortwörtliche Übereinstimmungen schnell und ist robust gegen Tippfehler.
  2. Vektor-Suche: Embeddings mit intfloat/multilingual-e5-large (1024 Dimensionen), HNSW-Index in pgvector. Findet semantisch ähnliche Inhalte unabhängig von der Wortwahl.
  3. Graph-Hops: Personalized PageRank durch den Wissensgraph in Neo4j, ausgehend von Knoten, die in den ersten beiden Stufen gefunden wurden. Standard-Tiefe zwei Hops. Bringt Entitäten, die nicht im Frage-Text stehen, aber eng verbunden sind (Personen zu Projekten, Verträge zu Mandanten).
  4. Identitäts- und Beziehungs-Stage: Heuristiken für Fragen, die auf eine konkrete Entität oder eine typische Beziehung abzielen — „Wer ist …", „Welche Verträge mit …".
  5. Reciprocal-Rank-Fusion: Die Ranglisten der Stufen werden mit RRF (k=60) zu einer Gesamt-Rangliste fusioniert. Treffer mit guter Position in mehreren Stufen wandern nach oben.
  6. Cross-Encoder-Rerank: Die Top-Kandidaten gehen durch einen BGE-Reranker. Das ist der teuerste Schritt, läuft aber nur auf einer kurzen Liste — die finale Sortierung ist deutlich präziser als jede einzelne Stufe für sich.

Was es bedeutet für die Praxis

  • Sie müssen nicht raten, ob eine Frage „semantisch" oder „faktenbasiert" ist — die Pipeline kombiniert beide Sichten.
  • Beziehungen im Wissensgraph zahlen sich aus. Eine isolierte Erinnerung ist findbar, eine mit drei Beziehungen liefert mehr Kontext bei verwandten Fragen.
  • Mehrsprachige Korpora funktionieren, weil das Embedding-Modell mehrsprachig ist. Sprache der Frage und Sprache der Erinnerung müssen nicht übereinstimmen.

Benchmarks

Die Pipeline wird gegen einen öffentlichen Benchmark geprüft: github.com/Schubeler-Consulting/knowmind-benchmark. Reproduzierbare Vergleiche mit Volltext, klassischem Vector-RAG und Dateinamen-Suche; auf dem dort dokumentierten Korpus erreicht die knowmind-Pipeline einen deutlich höheren Recall.

Weiterführend