Aufgaben

Dokumente hochladen

Lange Texte und PDF lassen sich direkt nach knowmind übertragen. knowmind zerlegt das Dokument in sinnvolle Abschnitte, erzeugt Vektor-Einbettungen je Abschnitt und macht den Inhalt damit semantisch durchsuchbar.

Zielgruppe
Alle Tarife. Empfohlen, sobald Sie strukturierte Quellen wie Handbücher, Verträge oder Whitepaper im Wissensspeicher pflegen möchten.

Voraussetzungen

  • Eingerichtetes knowmind-Konto
  • Dokument im Format Markdown, Klartext oder PDF (Text-PDF, keine reinen Scan-PDFs ohne OCR)
  • Maximale Größe pro Dokument: 10 MB
  • Für die CLI-Variante: knowmind-CLI installiert und angemeldet
Hinweis

Wann ein Dokument, wann eine Erinnerung?

Erinnerungen sind kurz (eine Notiz, ein Memo). Dokumente sind länger (Handbuch-Kapitel, Vertrag, Spezifikation). knowmind wählt für Dokumente automatisch das Chunking — eine Erinnerung bleibt eine Einheit.

Schritte

  1. 1

    Weg 1: Im Dashboard

    Im Dashboard auf Dokumente navigieren. Dort auf „Dokument hochladen" klicken, eine Datei auswählen, optional einen Titel überschreiben und bestätigen.

    Ergebnis: Das Dokument erscheint in der Liste mit Status Hochgeladen, wechselt nach einigen Sekunden auf Indexiert und ist dann mit Status Bereit durchsuchbar.

  2. 2

    Weg 2: Aus der Kommandozeile

    bash
    # Einzelne Datei
    knowmind upload ./handbuch-einarbeitung.md --title "Einarbeitungs-Handbuch v3"
    
    # Alle Markdown-Dateien aus einem Verzeichnis (idempotent, Content-Hash-basiert)
    knowmind sync ./docs --manifest ./.knowmind.manifest

    knowmind sync rechnet pro Datei einen Inhalts-Hash und überträgt nur das, was sich seit dem letzten Lauf geändert hat. Der Manifest-Pfad ist frei wählbar; legen Sie ihn in das Projekt-Verzeichnis und committen Sie ihn nicht (er gehört in die Ausschluss-Liste der Versionskontrolle).

    Ergebnis: Pro hochgeladenem Dokument erscheint eine Erfolgsmeldung mit Memory-ID und Anzahl der erzeugten Abschnitte.

  3. 3

    Weg 3: Über die API

    Für eigene Anwendungen geht der Upload auf POST /api/v1/ingest/document:

    bash
    curl -X POST https://knowmind.de/api/v1/ingest/document \
      -H "Authorization: Bearer kmt_…" \
      -H "Content-Type: application/json" \
      -d '{
        "title": "QM-Handbuch",
        "content": "<vollständiger Markdown-/Text-Inhalt>",
        "source": "internal-handbook-v3"
      }'

    Für sehr große Dokumente erfolgt die Chunking-Verarbeitung asynchron — die API liefert sofort eine document_id, der Status wird über die Dokumenten-Liste sichtbar.

  4. 4

    PDF hochladen

    PDFs werden im Dashboard direkt akzeptiert. knowmind extrahiert den Text-Layer; bei Scan-PDFs ohne OCR funktioniert das nicht verlässlich. Wenn das Ergebnis lückenhaft ist, das PDF vorher mit einem OCR-Werkzeug (etwa Adobe Acrobat oder Tesseract) aufbereiten und das Ergebnis als Markdown oder Text hochladen.

Prüfung des Ergebnisses

  • Im Dashboard unter Dokumente steht der Status Bereit.
  • Die Statistik-Kachel Erinnerungen ist um die Anzahl der erzeugten Abschnitte gestiegen.
  • Eine Suche nach einem Begriff aus dem Dokument liefert mindestens einen Abschnitt mit Quellenverweis auf das Dokument.

Fehlerbehebung

FehlermeldungUrsacheAuflösung
Upload schlägt mit „file too large" fehlDokument größer als 10 MB.Dokument in zwei oder mehr Teile splitten und einzeln hochladen.
Status bleibt auf „Indexiert" hängenEmbedding-Schritt im Hintergrund läuft noch oder Embedding-Provider nicht erreichbar.Bei BYOK-Setup prüfen, ob der hinterlegte Schlüssel gültig ist (Dashboard → BYOK-Schlüssel). Bei knowmind-Default-Embedding einige Minuten warten und neu laden.
PDF liefert leeren InhaltScan-PDF ohne OCR-Text-Layer.Mit einem OCR-Werkzeug Text extrahieren und stattdessen als Markdown oder Text hochladen.
knowmind sync: „permission denied"Manifest-Datei nicht beschreibbar.Dateirechte des Manifest-Pfads prüfen, anderen Pfad wählen oder Manifest löschen und neu erzeugen lassen.

Weiterführend