Konzept · Deutsch
Recall
Vier Stufen Hybrid-Pipeline. Reine Vector-Suche reicht nicht. Reine BM25-Suche reicht nicht. Reiner Graph reicht nicht. Die Kombination ja.
Pipeline-Übersicht
- Lexikal (BM25) — Postgres FTS mit deutscher Konfiguration findet exakte Begriffe und Eigennamen.
- Semantisch (pgvector) — BGE-M3-Embedding der Query, HNSW-Suche im 1024d-Raum. Findet Paraphrasen und Synonyme.
- Multi-Hop (Neo4j) — von den Top-Treffern propagiert die Suche bis zu 2 Hops weit. Findet, was thematisch dranhängt.
- Re-Rank (Reciprocal-Rank-Fusion) — die drei Stage-Ergebnisse werden mit RRF (k=60) zusammengeführt.
Warum Hybrid
Im eigenen Benchmark vom 2026-05-16 erreicht knowmind 80 % Recall@5 auf 15 deutschsprachigen Knowledge-Worker-Fragen — Postgres FTS allein liegt bei 13 %, ILIKE-Substring bei 0 %. Hybrid ist nicht „nice to have", sondern der einzige Weg zu brauchbaren Trefferraten.
Parameter
k— Anzahl der Treffer (1–25, default 5)hops— Graph-Distanz (0–3, default 2)query— natürlichsprachlich, deutsch oder englisch
Weiter: BYOK — eigene KI-Schlüssel · Vergleich gegen Konkurrenten