KI-Assistent für Engineering & Aftersales

Die KI, die Ihre Engineering-Daten versteht — und nie das Haus verlässt.

Kein bloßer KI-Assistent: Unser Produkt ist die Agentic-Hybrid-RAG-Pipeline. Sie macht klassische LLMs stärker und Ihr internes Wissen nutzbar — Assistenten und Apps entstehen nur obendrauf.

>70 % nutzen KI — nur 5,5 % mit messbarem EBIT-Effekt.

R.AgenticRAG schließt die Lücke — KI, die Ihr Firmenwissen belegbar nutzt. McKinsey · The State of AI ↗

DSGVO-konform · On-Premise-fähig · Deutsche Server · Engineered in Germany

Warum ROSI

Was uns besonders macht.

Sicher, geprüft, mitdenkend — und gemacht für Ihre technischen Daten.

Ihre Daten bleiben bei Ihnen

Alles läuft auf Ihren eigenen Servern oder in einer deutschen Cloud. Ihre Daten verlassen nie Ihr Haus und landen nicht bei großen US-Anbietern.

Geprüfte Qualität & Sicherheit

Wir sind nach ISO 27001 (Informationssicherheit) und ISO 9001 (Qualitätsmanagement) zertifiziert — geprüfte Standards, auf die Sie sich verlassen können.

Findet Antworten wie ein Experte

Statt nur nach Stichwörtern zu suchen, kombiniert unsere KI mehrere Suchwege und denkt in mehreren Schritten mit. So findet sie auch Antworten, die tief in Ihren Unterlagen stecken.

Antworten, die Sie nachvollziehen können

Jede Antwort zeigt, woher sie kommt — mit Verweis auf die genaue Stelle in Ihren Unterlagen. So verlassen Sie sich auf Belege statt blind auf die KI zu vertrauen.

Versteht Ihre Engineering-Daten

Unsere KI liest Ihre technischen Dateien direkt — von Steuergeräte-Beschreibungen über Messdaten bis zu Stücklisten und Spezifikationen. Gemacht für Fahrzeugentwicklung und Aftersales.

Baut auf Ihre Software auf

Mit unserem Agentic-Hybrid-RAG-Core erweitern wir bestehende Anwendungen oder bauen neue — fertig aus unserem Portfolio oder ganz nach Ihren Wünschen entwickelt.

Interaktive Demo

Erleben Sie den Unterschied — live.

Wählen Sie eine Frage und stellen Sie sie einmal ohne und einmal mit R.AgenticRAG. Sehen Sie, welche Datenquellen injiziert werden und wie der Kontext intelligent aufgebaut wird.

R.AgenticRAG · Demo-Konsole

Wählen Sie unten eine Frage und klicken Sie auf „Fragen“.

Beispiel-Fragenklicken Sie eine an, um sie zu stellen
Frage auswählen …
So funktioniert’s

Offenes Buch statt Auswendiglernen.

RAG gibt der KI Zugriff auf Ihre eigenen Unterlagen. Sie antwortet nicht aus dem Gedächtnis — sie schlägt die passende Stelle nach.

1

Ihre Frage

in normaler Sprache

2 Das ist RAG

Ihre Unterlagen

die KI sucht die Antwort darin

3

Belegte Antwort

mit Quelle — nachprüfbar

Ohne den mittleren Schritt rät die KI aus dem Gedächtnis. Mit ihm antwortet sie belegt — aus Ihrem Wissen.

Wir gehen weiter: Agentic Hybrid RAG

Das RAG-Prinzip + Hybrid-Suche + eigenständiger Agent.

Hybrid-Suche

Sucht auf drei Wegen gleichzeitig — und nimmt das Beste.

Stichwörter Bedeutung Zusammenhänge

Agentisch

Plant, prüft und verfeinert selbst — wie ein Kollege.

Plan Suchen Prüfen
R.AgenticRAG

Wie aus Ihren Daten eine verlässliche Antwort wird.

Vom Dokument bis zur fertigen Antwort — jeder Schritt nachvollziehbar, auf Wunsch komplett im eigenen Haus.

Anwendungen

Drei Wege, wie R.AgenticRAG bei Ihnen Wert schafft.

Zwei produktionsnahe Use Cases — und einen, den wir mit Ihnen entwickeln.

Chatbasierter KI-Assistent für Fahrzeugentwicklung und Werkstatt
Entwicklung oder Werkstatt

Chatbasierter KI-Assistent

Beantwortet Fragen in natürlicher Sprache — in der Entwicklung zu ODX-Diagnosedaten, DTC-Bedeutungen und Steuergeräten, in der Werkstatt zu Fehlercodes und Reparaturanleitungen. Alles aus internen Daten, ohne dass etwas das Haus verlässt.

Mehr erfahren
Diagnose-Resultat-Explorer — Fehlercodes und Diagnose-Services je Steuergerät analysieren und vergleichen
Entwicklung oder Werkstatt

Diagnose-Resultat-Explorer & Analyzer

Untersucht Diagnose-Resultate interaktiv: per Klick vordefinierte Informationen und Fragen zu den Ergebnissen abrufen — oder Modelle, Varianten und Dienste schnell miteinander vergleichen.

Mehr erfahren
Maßgeschneidert

Customer-Specific Assistant

Wir entwickeln gemeinsam die passende On-Top-Applikation für Ihren Use Case. Vom Discovery-Workshop bis zum produktiven Rollout.

Use Case besprechen
Use Case · Fahrzeugentwicklung

Vom Feldbefund zur Lösung — autonom.

R.AgenticRAG erkennt neue Tickets selbstständig, recherchiert in allen Wissensquellen und liefert belegte Ergebnisse — rund um die Uhr.

Erprobung · SW-Release 45V

Feldbeobachtung

Während der Erprobung des SW-Release 45V fällt im Feld eine Auffälligkeit auf: Ein sporadischer Fehler wird beobachtet und beanstandet.

Der Ingenieur meldet die Beobachtung über sein System
Jira Polarion DOORS
Beispiel DEF-2026-0473 P1 · Hoch Antrieb / E-Motor

Sporadischer Drehmomenteinbruch bei Lastwechsel über 6.000 1/min

Erprobungsträger E-Achse Gen3 · DTC P0CA1 · CAN-Trace zeigt Spannungsabfall am HV-Bus 12 ms vor Fehlerbild · reproduzierbar nur bei T_Inverter > 78 °C

Wissensquellen
Tickets & Anforderungen Jira · Polarion · DOORS
Spezifikationen Lastenhefte · Pflichtenhefte
Messdaten CAN · MDF · INCA · CANape
Erfahrungswissen Confluence · Wikis · Berichte
Datenbasen ODX · A2L · ARXML · CDD
Agentic Hybrid RAG

R.AgenticRAG

Autonomer Agent · LLM + Tools + Reasoning
  1. Defect analysieren
  2. Kontext abrufen
  3. Hypothesen bilden
  4. Maßnahmen ableiten
  5. Antwort zusammenstellen
Hybrid-Pipeline
EmbeddingVektor-DBRetrievalRe-RankingContext-Building
Ergebnisse für den Ingenieur
Zusammenfassung & Klassifizierung Knapper Steckbrief · Fehlerkategorie
Mögliche Fehlerpfade Root-Cause-Hypothesen mit Evidenz
Abstellprozesse 8D · Sofortmaßnahmen · Verantwortliche
Ähnliche Vorfälle Verweise auf gelöste Defects
Pull-Request: E-Motor-SG-SW Patch v3.4.2 → v3.4.3, Modul TorqueCtrl.c

R.AgenticRAG arbeitet wie ein Mitarbeiter — nur rund um die Uhr und mit Zugriff auf das gesamte Firmenwissen: Es erkennt neue Tickets selbstständig, bearbeitet sie ohne Zutun des Ingenieurs und stellt die Ergebnisse automatisch zu.

Erkennt Tickets selbstständig 24/7 im Einsatz Ohne Zutun des Ingenieurs Ergebnisse automatisch zugestellt
Produkt & Angebot

Drei Ebenen — so binden Sie R.AgenticRAG ein

Vom Code-Modul über die API bis zu fertigen Anwendungen — Sie entscheiden, wie tief wir einsteigen.

01 Code-Modul

R.AgenticRAG Core

Die Pipeline als eigenständige Komponente.

Die komplette Pipeline als Modul, das in Ihrer Infrastruktur läuft. Ihr Team betreibt und erweitert sie selbst.

  • On-Premise oder deutsche Cloud
  • Freie Modell-Wahl (Qwen3, DeepSeek, …)
  • Volle Kontrolle über Ihre Daten

Für wen Teams mit eigener Engineering-Abteilung, die maximale Kontrolle wollen.

02 Integration

R.AgenticRAG:API

Brücke in bestehende Workflows und Anwendungen.

Bettet R.AgenticRAG in Ihre vorhandenen Tools ein — Antworten erscheinen dort, wo Ihr Team ohnehin arbeitet.

  • REST- und Streaming-Endpoints
  • Authentifizierung & Rechte
  • Multi-Tenant-fähig für Konzern-Setups

Für wen Unternehmen, die bestehende Anwendungen um intelligente Suche erweitern wollen.

03 Anwendungen

Apps & Autonome Pipelines

Fertige Apps oder R.AgenticRAG als Baustein in Automation.

Produktionsbereite Anwendungen für Engineering und Aftersales — oder R.AgenticRAG als Baustein in Ihren autonomen Pipelines.

Aktuell verfügbar
  • R.DiagX:AIAgent
  • Werkstatt-Assistent
  • Engineering Knowledge Hub
  • Custom-Lösungen

Für wen Fachbereiche, die schnell starten — oder Teams, die R.AgenticRAG in Automatisierung einbetten. Anwendungen ansehen →

Betriebsmodelle

Ihre Architektur — frei kombinierbar.

LLM-Inferenz, Datenhaltung und Applikation lassen sich beliebig auf On-Premise, eigene KI-Server oder die deutsche Cloud verteilen. So behalten Sie höchste Flexibilität, volle Individualität und die komplette Hoheit über Ihre Datenflüsse.

Drei Bausteine — frei platzierbar:
LLM-Inferenz Datenhaltung Applikation

Hybrid & leistungsstark

Daten lokal, Rechenpower dediziert

  • Applikation On-Premise
  • Datenhaltung On-Premise
  • LLM-Inferenz Eigener KI-Server

Ihre Daten bleiben im Haus, während die LLM-Inferenz auf einem dedizierten KI-/GPU-Server mit voller Performance läuft.

Vollständig gemanagt

Schlüsselfertig betrieben

  • Applikation Deutsche Cloud
  • Datenhaltung Deutsche Cloud
  • LLM-Inferenz Deutsche Cloud

Wir betreiben alle Komponenten DSGVO-konform in der deutschen Cloud — Sie nutzen, wir kümmern uns um den Betrieb.

Höchste Flexibilität Volle Individualität Sicherheit & Datenhoheit
Vorgehen

In klaren Phasen — vom Erstgespräch bis zum Betrieb.

Jede Phase liefert ein Ergebnis. Sie entscheiden, ob wir weitermachen.

Phase 01

Erstgespräch

kostenlos

Wir verstehen Ihre Ziele — und sagen ehrlich, ob RAG passt.

Phase 02

Machbarkeit & Demo

2–4 Wochen

Eine erste lauffähige Demo mit Ihren Daten — kein Slideware, echtes System.

Phase 03

Pilotphase

6–12 Wochen

Echte Datenmengen, Integration und messbare Erfolgskriterien.

Phase 04

Integration & Rollout

Anbindung an Ihre Systeme, Rechte, Monitoring und Schulung.

Phase 05

Betrieb & Weiterentwicklung

Wartung, Updates und neue Datenquellen — wir bleiben an Ihrer Seite.

Vor dem Gespräch

Antworten auf die häufigsten Fragen

Worüber wir am häufigsten reden — bevor Sie uns anschreiben.

Warum lokale LLMs — Stichwort Datenschutz?

Cloud-LLMs verarbeiten Ihre Anfragen auf Servern, die letztlich US-Gesetzgebung unterliegen — selbst wenn der Anbieter EU-Rechenzentren betreibt, gilt der CLOUD Act für die Mutterfirma. Für Engineering-Daten (Steuergeräte-Code, Konstruktionspläne, Kunden-Spezifikationen) ist das kein Restrisiko, sondern ein Ausschlusskriterium.

Lokale LLMs laufen auf Ihrer Hardware oder in einem Rechenzentrum, das vollständig Ihrer Hoheit untersteht. Kein Token verlässt den Perimeter, kein Telemetrie-Leak, keine Hyperscaler-Abhängigkeit. Zusätzlich: keine Latenz durch Remote-Calls, kein API-Rate-Limit, planbare Kosten.

Was ist RAG?

RAG (Retrieval-Augmented Generation) gibt einem Sprachmodell vor jeder Antwort Zugriff auf Ihre eigenen Dokumente. Ein Retriever holt die relevantesten Ausschnitte, das Modell antwortet ausschließlich auf deren Basis — mit Zitaten und damit prüfbar.

Der Vorteil gegenüber Fine-Tuning: neue Dokumente sind sofort verfügbar (kein Retraining), Halluzinationen sinken drastisch, und Sie behalten die Kontrolle darüber, was das Modell überhaupt sehen darf. Wer welche Antwort bekommt, lässt sich auf Quellenebene steuern — wichtig für vertrauliche Bereiche und Berechtigungsstufen.

Was ist Hybrid Agentic RAG?

Klassisches RAG nutzt einen einzigen Retriever — meist nur Vektor-Suche. Das funktioniert für einfache Faktenfragen, scheitert aber bei komplexen Engineering-Anfragen wie „Welche Steuergeräte beeinflussen die Bremstemperatur in Revision 4.2 und welche DTCs sind neu?

  • Hybrid heißt: mehrere Retrieval-Strategien laufen parallel — BM25 für Fachbegriffe, Vektoren für Semantik, GraphRAG für Beziehungen. Reciprocal Rank Fusion vereint die Ergebnisse.
  • Agentic heißt: ein Agent zerlegt komplexe Fragen, plant mehrere Retrieval-Schritte, prüft Zwischenergebnisse und iteriert. Statt einer einzelnen Antwort entsteht ein nachvollziehbarer Reasoning-Pfad — auditierbar und mit vollständiger Quellenkette.
Warum R.AgenticRAG für meine Firma?

Drei Punkte, die wir liefern und Sie sonst kaum bekommen:

  • Engineering-native Parser: A2L, ODX, MDF, DBC, PDF-Spezifikationen — schema-bewusst, nicht im generischen Text-Splitter zerhackt. Eine DiagnosticTroubleCode-Definition bleibt als Einheit erhalten, kein Chunk-Break mitten im Freeze-Frame.
  • On-Premise oder deutsche Cloud: Hetzner, IONOS, Open Telekom Cloud — oder direkt bei Ihnen im Rechenzentrum. Keine US-Hyperscaler, keine Daten-Exfiltration, kein Erklärungsbedarf gegenüber dem Datenschutzbeauftragten.
  • Eigene Pipeline statt Black-Box-SaaS: R.AgenticRAG basiert auf .NET 9, Lucene.NET und Kùzu. Sie bekommen die Architektur erklärt, nicht nur API-Endpoints. Wartbar, erweiterbar, kein Vendor-Lock-in.

Dazu unser Vorgehen: Erstgespräch → Demo → Pilot → Rollout. Sie entscheiden nach jeder Phase neu, ob wir weitermachen.

Was macht ROSI Technology GmbH?

Wir sind ein deutsches Software-Unternehmen aus Leonberg und entwickeln KI für Engineering und Aftersales, die Ihre Daten nicht aus dem Haus lässt. Kern ist R.AgenticRAG — eine Hybrid-Agentic-RAG-Pipeline, die technische Unterlagen (Steuergeräte-Beschreibungen, Messdaten, Pläne, Spezifikationen) direkt liest und belegbare Antworten mit Quellenangabe liefert.

Wir liefern auf drei Ebenen: als Code-Modul (R.AgenticRAG Core) für Ihr eigenes Team, als Integration (R.AgenticRAG:API) in bestehende Anwendungen, oder als fertige Apps für Engineering und Aftersales. Alles läuft on-premise oder in einer deutschen Cloud — zertifiziert nach ISO 27001 und ISO 9001.

Wieviel würde mich eine Integration in meine Anwendung ca. kosten?

Das hängt vom Umfang ab — von einer schlanken API-Anbindung an ein bestehendes Tool bis zur maßgeschneiderten Anwendung. Als grobe Orientierung:

  • Integrationen starten typischerweise bei ca. 8.000 € und bewegen sich je nach Umfang im Bereich 8.000–120.000 €.
  • Individuelle Entwicklung rechnen wir zum Tagessatz ab 920 € ab.

Erstgespräch und eine grobe Datensichtung sind kostenlos — dabei klären wir Datenquellen, Schnittstellen und Zielbild, und Sie bekommen ein belastbares Angebot. Optional setzen wir für wenig Geld einen Proof of Concept auf, mit dem Sie den Nutzen an Ihren eigenen Daten sehen, bevor Sie sich festlegen.

Was ist der Unterschied zwischen Cloud-LLMs und Open-Weight-LLMs?

Cloud-LLMs (z. B. GPT, Claude, Gemini) sind geschlossene Modelle, die Sie nur als Dienst über eine API nutzen. Das Modell läuft auf den Servern des Anbieters — Ihre Anfragen verlassen also Ihr Haus, es gelten fremde Nutzungsbedingungen, API-Kosten und Rate-Limits, und der Anbieter kann das Modell jederzeit ändern oder abschalten.

Open-Weight-LLMs (z. B. Llama, Qwen3, Mistral, DeepSeek, Gemma) stellen ihre Modell-Gewichte öffentlich bereit. Sie betreiben das Modell auf Ihrer eigenen Hardware:

  • Kein Datenabfluss — kein Token verlässt Ihren Perimeter.
  • Planbare Kosten statt nutzungsabhängiger API-Gebühren, keine Rate-Limits.
  • Freie Modellwahl und kein Vendor-Lock-in — das Modell bleibt Ihnen erhalten.

Hinweis: Open-Weight heißt „Gewichte frei verfügbar” — nicht zwingend vollständig Open Source (Trainingsdaten und -code sind nicht immer offen). Genau auf solche lokal betriebenen Open-Weight-Modelle setzt R.AgenticRAG setzt.

Unterstützt und berät ROSI Technology auch Unternehmen zu KI?

Ja. Neben unserem Produkt begleiten wir Unternehmen auch beratend auf dem Weg zu KI — von der ersten Standortbestimmung über die Auswahl sinnvoller Anwendungsfälle bis zur konkreten Umsetzung. Sie bekommen also nicht nur Software, sondern einen Partner, der Technik und Nutzen zusammenbringt.

Wir arbeiten dabei individuell statt von der Stange — zugeschnitten auf Ihre Branche, Datenlage und Ziele. Schildern Sie uns einfach Ihre Anfrage; das Erstgespräch ist kostenlos.

Kontakt

Lassen Sie uns über Ihre Datenlandschaft sprechen.

Wir hören erst zu, dann zeigen wir, was geht. Kein Pitch-Marathon — ein konkretes Gespräch über Ihre Datenquellen, Sicherheitsanforderungen und Use Cases.

Schreiben Sie uns direkt — wir antworten innerhalb eines Werktages.

sales@rosi-technology.de
  • ROSI · Engineered in Germany
  • Vertraulich · NDA vor jeder Demo möglich
Maxi, Ihr persönlicher Ansprechpartner im Vertrieb bei ROSI
Maxi Ihr persönlicher Ansprechpartner · Vertrieb

„Erzählen Sie mir von Ihren Datenquellen und Use Cases — gemeinsam finden wir den schnellsten Weg zur passenden Lösung. Unkompliziert, ehrlich und ohne Pitch-Marathon.“

Mit Maxi schreiben

Schreiben Sie uns

Pflichtfelder sind mit * markiert.

Wir antworten innerhalb eines Werktages.

Verbindung wird wiederhergestellt …

Einen Moment — wir verbinden Sie wieder mit dem Server.

Versuch 1 von 8 · nächster in 0 s

Verbindung unterbrochen

Wir konnten den Server nicht erreichen. Bitte prüfen Sie Ihre Internetverbindung.

Sitzung abgelaufen

Die Verbindung wurde zu lange unterbrochen. Bitte laden Sie die Seite neu, um fortzufahren.