Konzept · Deutsch

Recall

Vier Stufen Hybrid-Pipeline. Reine Vector-Suche reicht nicht. Reine BM25-Suche reicht nicht. Reiner Graph reicht nicht. Die Kombination ja.

Pipeline-Übersicht

  1. Lexikal (BM25) — Postgres FTS mit deutscher Konfiguration findet exakte Begriffe und Eigennamen.
  2. Semantisch (pgvector) — BGE-M3-Embedding der Query, HNSW-Suche im 1024d-Raum. Findet Paraphrasen und Synonyme.
  3. Multi-Hop (Neo4j) — von den Top-Treffern propagiert die Suche bis zu 2 Hops weit. Findet, was thematisch dranhängt.
  4. Re-Rank (Reciprocal-Rank-Fusion) — die drei Stage-Ergebnisse werden mit RRF (k=60) zusammengeführt.

Warum Hybrid

Im eigenen Benchmark vom 2026-05-16 erreicht knowmind 80 % Recall@5 auf 15 deutschsprachigen Knowledge-Worker-Fragen — Postgres FTS allein liegt bei 13 %, ILIKE-Substring bei 0 %. Hybrid ist nicht „nice to have", sondern der einzige Weg zu brauchbaren Trefferraten.

Parameter

  • k — Anzahl der Treffer (1–25, default 5)
  • hops — Graph-Distanz (0–3, default 2)
  • query — natürlichsprachlich, deutsch oder englisch

Weiter: BYOK — eigene KI-Schlüssel · Vergleich gegen Konkurrenten