Apivanta · Extraktio
Aus ungenutzten
Files wird
verwertbares Wissen.
Wir strukturieren Ihr Dokumentenarchiv: klassifiziert, mit Metadaten, migrationsbereit. In Wochen, nicht Jahren.
100 % On-Premise - keine Cloud, keine externen APIs
Erstgespräch vereinbaren
Extraktio
KI · On-Premise
- Keine Cloud
- Keine externen APIs
- Eigene GPU-Infrastruktur
- Physisch in der Schweiz
Das Problem
Daten vorhanden. Nicht nutzbar.
Baupläne, Verträge, CAD-Zeichnungen, Protokolle - verteilt, unbenannt, unsuchbar. Das Archiv existiert. Genutzt wird es nicht.
Unstrukturierte Archive
Gewachsene Ordnerstrukturen, keine einheitliche Benennung, keine Metadaten. Niemand weiss, was wo liegt.
Wissen steckt in Köpfen
Wer lange dabei ist, weiss wo was liegt. Kein System trägt dieses Wissen.
Inkonsistente Benennung
«Datenblatt», «Datenblätter», «data sheet» - drei Begriffe, null gemeinsame Suchergebnisse.
Migration = Datenleiche verschieben
Wer ohne Bereinigung migriert, kopiert das Chaos von System A nach System B.
SharePoint End-of-Life - 14. Juli 2026
SharePoint Server 2016/2019 verliert den Support. Faktischer Migrationszwang für alle Bestandssysteme - ohne Datenbereinigung wird das Problem nur weitergezogen.
DSGVO-Compliance
Aufbewahrungsfristen, Löschpflichten, Zugriffshistorien - ohne strukturierte Metadaten kaum effizient umsetzbar.
Die Lösung
Ihr Projekt. Unser Vorgehen.
Vier Phasen mit klaren Übergaben. Sie definieren die Anforderungen. Wir liefern.
01
Datenanalyse
Wir sichten Ihr Archiv und identifizieren Formate, Mengen und Muster. Sie erhalten eine klare Einschätzung: Was vorhanden ist, was fehlt und was es braucht.
02
Konfiguration & Taxonomie
Gemeinsam definieren wir Ihre Metadaten-Struktur: Gebäude, Dokumenttypen, Phasen, Disziplinen. Basierend auf Ihrer bestehenden Nomenklatur und Branchenstandards (SIA, KBOB). Wir konfigurieren die Pipeline auf Ihre Logik.
03
Test Buckets & Validierung
Wir verarbeiten repräsentative Testmengen und prüfen die Ergebnisse gemeinsam. Iteration, bis die Qualität stimmt. Erst dann geht es in die Breite.
04
Vollverarbeitung & Übergabe
Der gesamte Bestand wird verarbeitet. Sie erhalten strukturierte Metadaten als CSV oder JSON. Jedes Feld dokumentiert, jede Entscheidung nachvollziehbar.
Vier Analyse-Schichten im Einsatz
Eingang
Dokument
PDF · CAD · Office
Bild · Text
Bild · Text
5 Format-Gruppen
01
Pfad & Dateiname
Ordnerstruktur & Dateiname als erste Erkennungsquelle
02
Text-Extraktion
Maschinenlesbarer Volltext aus PDF, Office & CAD
03
Vision AI
Titelblöcke, Stempel & Layouts visuell gelesen - auch CAD
04
Keyword-Abgleich
DE + EN Synonyme → normalisierte Codes
B19009Ausgang
Strukturierte
Metadaten
Metadaten
Gebäude
Dokumenttyp
Phase
Disziplin
Geschoss
+ 7 weitere
97%
Trefferquote
Aufwand
Intern machbar. Aber in welchem Zeitrahmen?
80.000 Dokumente manuell aufarbeiten bedeutet 4.000 Stunden Aufwand. Die Frage ist: Wie lange, und wer macht es?
1 Mitarbeiter intern
~25 Mte.
4.000 Stunden
Vollzeiteinsatz
Vollzeiteinsatz
3 Mitarbeiter intern
~8 Mte.
4.000 Stunden
aufgeteilt
aufgeteilt
Mit Extraktio
Wir übernehmen
~4–6 Wo.
Analyse, Konfiguration,
Verarbeitung, Übergabe
Verarbeitung, Übergabe
Basis: 80.000 Dokumente × 3 Min. manuelle Bearbeitungszeit = 4.000 Stunden · 1 Mitarbeiter intern = ~25 Monate Vollzeit = ~CHF 120.000
Referenz
Bewiesene Ergebnisse.
80.000+
Dokumente
Produktiver Einsatz
490+
Gebäude
vollständig strukturiert
600+
Dokumenttypen
im System abgebildet
97%
Trefferquote
in relevanten Feldern
Referenz: Universität Zürich (UZH)
Produktiver Einsatz beim SharePoint-Migrationsprojekt der UZH.
Vorher / Nachher
Der Unterschied in der Praxis.
✕ Vorher
Navigation durch Ordnerstrukturen - keine Alternative
Wissen steckt in Köpfen
«Datenblatt» findet nicht «Datenblätter»
Migration = Chaos von A nach B kopieren
Aufbewahrungspflichten? Unklar.
✓ Nachher
«Alle Elektropläne, Gebäude X» - Ergebnis in Sekunden
Wissen steckt in strukturierten Metadaten
Code B19009 findet alle - egal wie benannt
Migration auf Basis sauberer, validierter Metadaten
Aufbewahrungspflichten: transparent und nachweisbar
Warum Extraktio
Was uns unterscheidet.
Keine Cloud, keine externen APIs
Wir verarbeiten Ihre Daten auf unseren eigenen Rechnern und GPUs in der Schweiz. Nichts davon geht in die Cloud oder an Drittanbieter. Nach der Verarbeitung erhalten Sie die strukturierten Ergebnisse. Ihre Quelldaten bleiben unverändert.
Wir übernehmen. Sie entscheiden.
Ihr Team definiert die Anforderungen. Wir kümmern uns um Analyse, Konfiguration, Testverarbeitung und Übergabe. Kein interner Aufwand, keine Schulungen, kein neues Tool, das jemand bedienen muss.
Jede Entscheidung nachvollziehbar
Jedes Metadaten-Feld hat eine dokumentierte Quelle und eine klare Regel. Kein opakes Confidence-Scoring. Jede Klassifikation ist nachprüfbar.
Was danach möglich wird
Und dann?
Strukturierte Daten sind die Grundlage für alles Weitere: Suche, Compliance, Migration, KI-Anwendungen.
Migration
Saubere, validierte Metadaten als Grundlage - kein Chaos übertragen, sondern strukturierte Inhalte migrieren.
Strukturierte Suche
«Alle Elektropläne, Gebäude X» - gefiltert nach Metadaten in Sekunden. Kein Ordner-Klicken mehr.
Compliance
Aufbewahrungsfristen und Löschpflichten pro Dokument transparent dokumentiert und jederzeit auditierbar.
KI-Anwendungen als nächster Schritt
Semantic Search, RAG, Knowledge Graphs: erst auf geordneten Daten kann KI wirklich arbeiten.
Jetzt starten
Erstgespräch vereinbaren
Lassen Sie uns Ihre Dokumentensituation besprechen -
kostenlos und unverbindlich.

David Parolo
Business & Prozesse

Mario Saladino
Tech & Produkt