KI-Assistent für Engineering & Aftersales

Die KI, die Ihre Engineering-Daten versteht — und nie das Haus verlässt.

Name: R.AgenticRAG
Brand: ROSI

Kein bloßer KI-Assistent: Unser Produkt ist die Agentic-Hybrid-RAG-Pipeline. Sie macht klassische LLMs stärker und Ihr internes Wissen nutzbar — Assistenten und Apps entstehen nur obendrauf.

>70 % nutzen KI — nur 5,5 % mit messbarem EBIT-Effekt.

R.AgenticRAG schließt die Lücke — KI, die Ihr Firmenwissen belegbar nutzt. McKinsey · The State of AI ↗

Erstgespräch vereinbaren R.AgenticRAG entdecken

DSGVO-konform · On-Premise-fähig · Deutsche Server · Engineered in Germany

Warum ROSI

Was uns besonders macht.

Sicher, geprüft, mitdenkend — und gemacht für Ihre technischen Daten.

Ihre Daten bleiben bei Ihnen

Alles läuft auf Ihren eigenen Servern oder in einer deutschen Cloud. Ihre Daten verlassen nie Ihr Haus und landen nicht bei großen US-Anbietern.

Geprüfte Qualität & Sicherheit

Wir sind nach ISO 27001 (Informationssicherheit) und ISO 9001 (Qualitätsmanagement) zertifiziert — geprüfte Standards, auf die Sie sich verlassen können.

Findet Antworten wie ein Experte

Statt nur nach Stichwörtern zu suchen, kombiniert unsere KI mehrere Suchwege und denkt in mehreren Schritten mit. So findet sie auch Antworten, die tief in Ihren Unterlagen stecken.

Antworten, die Sie nachvollziehen können

Jede Antwort zeigt, woher sie kommt — mit Verweis auf die genaue Stelle in Ihren Unterlagen. So verlassen Sie sich auf Belege statt blind auf die KI zu vertrauen.

Versteht Ihre Engineering-Daten

Unsere KI liest Ihre technischen Dateien direkt — von Steuergeräte-Beschreibungen über Messdaten bis zu Stücklisten und Spezifikationen. Gemacht für Fahrzeugentwicklung und Aftersales.

Baut auf Ihre Software auf

Mit unserem Agentic-Hybrid-RAG-Core erweitern wir bestehende Anwendungen oder bauen neue — fertig aus unserem Portfolio oder ganz nach Ihren Wünschen entwickelt.

Interaktive Demo

Erleben Sie den Unterschied — live.

Wählen Sie eine Frage und stellen Sie sie einmal ohne und einmal mit R.AgenticRAG. Sehen Sie, welche Datenquellen injiziert werden und wie der Kontext intelligent aufgebaut wird.

R.AgenticRAG · Demo-Konsole

Wählen Sie unten eine Frage und klicken Sie auf „Fragen“.

Beispiel-Fragenklicken Sie eine an, um sie zu stellen

Frage auswählen …

So funktioniert’s

Offenes Buch statt Auswendiglernen.

RAG gibt der KI Zugriff auf Ihre eigenen Unterlagen. Sie antwortet nicht aus dem Gedächtnis — sie schlägt die passende Stelle nach.

Ihre Frage

in normaler Sprache

2 Das ist RAG

Ihre Unterlagen

die KI sucht die Antwort darin

Belegte Antwort

mit Quelle — nachprüfbar

Ohne den mittleren Schritt rät die KI aus dem Gedächtnis. Mit ihm antwortet sie belegt — aus Ihrem Wissen.

Wir gehen weiter: Agentic Hybrid RAG

Das RAG-Prinzip + Hybrid-Suche + eigenständiger Agent.

Hybrid-Suche

Sucht auf drei Wegen gleichzeitig — und nimmt das Beste.

Stichwörter Bedeutung Zusammenhänge

Agentisch

Plant, prüft und verfeinert selbst — wie ein Kollege.

Plan Suchen Prüfen

R.AgenticRAG

Wie aus Ihren Daten eine verlässliche Antwort wird.

Vom Dokument bis zur fertigen Antwort — jeder Schritt nachvollziehbar, auf Wunsch komplett im eigenen Haus.

Agentic RAG Pfad So läuft eine Anfrage durch die Pipeline — Schritt für Schritt.

Frage

Welche Services erfassen die Temperaturmesswerte…

Verstehen

Klärt, was wirklich gefragt ist.

Planen

Wählt die passenden Quellen aus.

Agent

Zerlegt komplexe Fragen in Schritte.

Suchen

Durchsucht Ihre Dokumente nach relevanten Stellen.

Bewerten

Sortiert die Treffer nach Relevanz.

Formulieren

Lokales Sprachmodell schreibt die Antwort.

Antwort

Mit Quellenangabe — vollständig nachvollziehbar.

Anwendungen

Drei Wege, wie R.AgenticRAG bei Ihnen Wert schafft.

Zwei produktionsnahe Use Cases — und einen, den wir mit Ihnen entwickeln.

Entwicklung oder Werkstatt

Chatbasierter KI-Assistent

Beantwortet Fragen in natürlicher Sprache — in der Entwicklung zu ODX-Diagnosedaten, DTC-Bedeutungen und Steuergeräten, in der Werkstatt zu Fehlercodes und Reparaturanleitungen. Alles aus internen Daten, ohne dass etwas das Haus verlässt.

Mehr erfahren

Diagnose-Resultat-Explorer — Fehlercodes und Diagnose-Services je Steuergerät analysieren und vergleichen

Entwicklung oder Werkstatt

Diagnose-Resultat-Explorer & Analyzer

Untersucht Diagnose-Resultate interaktiv: per Klick vordefinierte Informationen und Fragen zu den Ergebnissen abrufen — oder Modelle, Varianten und Dienste schnell miteinander vergleichen.

Mehr erfahren

Maßgeschneidert

Customer-Specific Assistant

Wir entwickeln gemeinsam die passende On-Top-Applikation für Ihren Use Case. Vom Discovery-Workshop bis zum produktiven Rollout.

Use Case besprechen

Use Case · Fahrzeugentwicklung

Vom Feldbefund zur Lösung — autonom.

R.AgenticRAG erkennt neue Tickets selbstständig, recherchiert in allen Wissensquellen und liefert belegte Ergebnisse — rund um die Uhr.

Erprobung · SW-Release 45V

Feldbeobachtung

Während der Erprobung des SW-Release 45V fällt im Feld eine Auffälligkeit auf: Ein sporadischer Fehler wird beobachtet und beanstandet.

Der Ingenieur meldet die Beobachtung über sein System

Jira Polarion DOORS

Beispiel DEF-2026-0473 P1 · Hoch Antrieb / E-Motor

Sporadischer Drehmomenteinbruch bei Lastwechsel über 6.000 1/min

Erprobungsträger E-Achse Gen3 · DTC P0CA1 · CAN-Trace zeigt Spannungsabfall am HV-Bus 12 ms vor Fehlerbild · reproduzierbar nur bei T_Inverter > 78 °C

Wissensquellen

Tickets & Anforderungen Jira · Polarion · DOORS

Spezifikationen Lastenhefte · Pflichtenhefte

Messdaten CAN · MDF · INCA · CANape

Erfahrungswissen Confluence · Wikis · Berichte

Datenbasen ODX · A2L · ARXML · CDD

Agentic Hybrid RAG

R.AgenticRAG

Autonomer Agent · LLM + Tools + Reasoning

Defect analysieren
Kontext abrufen
Hypothesen bilden
Maßnahmen ableiten
Antwort zusammenstellen

Hybrid-Pipeline

EmbeddingVektor-DBRetrievalRe-RankingContext-Building

Ergebnisse für den Ingenieur

Zusammenfassung & Klassifizierung Knapper Steckbrief · Fehlerkategorie

Mögliche Fehlerpfade Root-Cause-Hypothesen mit Evidenz

Abstellprozesse 8D · Sofortmaßnahmen · Verantwortliche

Ähnliche Vorfälle Verweise auf gelöste Defects

Pull-Request: E-Motor-SG-SW Patch v3.4.2 → v3.4.3, Modul TorqueCtrl.c

R.AgenticRAG arbeitet wie ein Mitarbeiter — nur rund um die Uhr und mit Zugriff auf das gesamte Firmenwissen: Es erkennt neue Tickets selbstständig, bearbeitet sie ohne Zutun des Ingenieurs und stellt die Ergebnisse automatisch zu.

Erkennt Tickets selbstständig 24/7 im Einsatz Ohne Zutun des Ingenieurs Ergebnisse automatisch zugestellt

Produkt & Angebot

Drei Ebenen — so binden Sie R.AgenticRAG ein

Vom Code-Modul über die API bis zu fertigen Anwendungen — Sie entscheiden, wie tief wir einsteigen.

01 Code-Modul

R.AgenticRAG Core

Die Pipeline als eigenständige Komponente.

Die komplette Pipeline als Modul, das in Ihrer Infrastruktur läuft. Ihr Team betreibt und erweitert sie selbst.

On-Premise oder deutsche Cloud
Freie Modell-Wahl (Qwen3, DeepSeek, …)
Volle Kontrolle über Ihre Daten

Für wen Teams mit eigener Engineering-Abteilung, die maximale Kontrolle wollen.

02 Integration

R.AgenticRAG:API

Brücke in bestehende Workflows und Anwendungen.

Bettet R.AgenticRAG in Ihre vorhandenen Tools ein — Antworten erscheinen dort, wo Ihr Team ohnehin arbeitet.

REST- und Streaming-Endpoints
Authentifizierung & Rechte
Multi-Tenant-fähig für Konzern-Setups

Für wen Unternehmen, die bestehende Anwendungen um intelligente Suche erweitern wollen.

03 Anwendungen

Apps & Autonome Pipelines

Fertige Apps oder R.AgenticRAG als Baustein in Automation.

Produktionsbereite Anwendungen für Engineering und Aftersales — oder R.AgenticRAG als Baustein in Ihren autonomen Pipelines.

Aktuell verfügbar

R.DiagX:AIAgent
Werkstatt-Assistent
Engineering Knowledge Hub
Custom-Lösungen

Für wen Fachbereiche, die schnell starten — oder Teams, die R.AgenticRAG in Automatisierung einbetten. Anwendungen ansehen →

Betriebsmodelle

Ihre Architektur — frei kombinierbar.

LLM-Inferenz, Datenhaltung und Applikation lassen sich beliebig auf On-Premise, eigene KI-Server oder die deutsche Cloud verteilen. So behalten Sie höchste Flexibilität, volle Individualität und die komplette Hoheit über Ihre Datenflüsse.

Drei Bausteine — frei platzierbar:

LLM-Inferenz Datenhaltung Applikation

Maximale Sicherheit

Maximale Datenhoheit

Alles im eigenen Haus

Applikation On-Premise
Datenhaltung On-Premise
LLM-Inferenz On-Premise

Applikation, Daten und Inferenz laufen vollständig auf Ihrer Infrastruktur — kein Byte verlässt Ihr Netz.

Hybrid & leistungsstark

Daten lokal, Rechenpower dediziert

Applikation On-Premise
Datenhaltung On-Premise
LLM-Inferenz Eigener KI-Server

Ihre Daten bleiben im Haus, während die LLM-Inferenz auf einem dedizierten KI-/GPU-Server mit voller Performance läuft.

Vollständig gemanagt

Schlüsselfertig betrieben

Applikation Deutsche Cloud
Datenhaltung Deutsche Cloud
LLM-Inferenz Deutsche Cloud

Wir betreiben alle Komponenten DSGVO-konform in der deutschen Cloud — Sie nutzen, wir kümmern uns um den Betrieb.

Höchste Flexibilität Volle Individualität Sicherheit & Datenhoheit

Vorgehen

In klaren Phasen — vom Erstgespräch bis zum Betrieb.

Jede Phase liefert ein Ergebnis. Sie entscheiden, ob wir weitermachen.

Phase 01

Erstgespräch

kostenlos

Wir verstehen Ihre Ziele — und sagen ehrlich, ob RAG passt.

Phase 02

Machbarkeit & Demo

2–4 Wochen

Eine erste lauffähige Demo mit Ihren Daten — kein Slideware, echtes System.

Phase 03

Pilotphase

6–12 Wochen

Echte Datenmengen, Integration und messbare Erfolgskriterien.

Phase 04

Integration & Rollout

Anbindung an Ihre Systeme, Rechte, Monitoring und Schulung.

Phase 05

Betrieb & Weiterentwicklung

Wartung, Updates und neue Datenquellen — wir bleiben an Ihrer Seite.

Team

Die Köpfe hinter ROSI.

Erfahrung aus Engineering, Forschung und Vertrieb — vereint in einem Team, das KI greifbar macht.

Dr.-Ing. Michael Grimm

Geschäftsführer (CEO)

Michael verbindet zwei Jahrzehnte Erfahrung in der Fahrzeugentwicklung mit einem klaren Blick für das Machbare. Als Geschäftsführer steckt er die Richtung ab, hört Ihren Anforderungen zu und sorgt dafür, dass aus Forschung echte Produkte werden — pragmatisch, ehrlich und mit dem Anspruch, dass jede Lösung im Alltag bestehen muss.

Dr.-Ing. Kordian Komarek

Technischer Leiter (CTO)

Kordian ist der Architekt unserer Agentic-Hybrid-RAG-Pipeline. Mit tiefer Expertise in KI, Software-Architektur und Datenintegration baut er die Technik, die Ihre Engineering-Daten verstehbar macht — sicher, nachvollziehbar und auf Ihre Infrastruktur zugeschnitten.

Moch

Vertrieb & Kundenbeziehungen (Sales)

Moch ist Ihr erster Ansprechpartner — und Übersetzer zwischen Ihrer Welt und unserer Technik. Statt vorgefertigter Pitches stellt er die richtigen Fragen, versteht Ihre Datenlandschaft und sorgt dafür, dass aus dem ersten Gespräch ein Vorhaben wird, das wirklich zu Ihnen passt.

Vor dem Gespräch

Antworten auf die häufigsten Fragen

Worüber wir am häufigsten reden — bevor Sie uns anschreiben.

Warum lokale LLMs — Stichwort Datenschutz?

Cloud-LLMs verarbeiten Ihre Anfragen auf Servern, die letztlich US-Gesetzgebung unterliegen — selbst wenn der Anbieter EU-Rechenzentren betreibt, gilt der CLOUD Act für die Mutterfirma. Für Engineering-Daten (Steuergeräte-Code, Konstruktionspläne, Kunden-Spezifikationen) ist das kein Restrisiko, sondern ein Ausschlusskriterium.

Lokale LLMs laufen auf Ihrer Hardware oder in einem Rechenzentrum, das vollständig Ihrer Hoheit untersteht. Kein Token verlässt den Perimeter, kein Telemetrie-Leak, keine Hyperscaler-Abhängigkeit. Zusätzlich: keine Latenz durch Remote-Calls, kein API-Rate-Limit, planbare Kosten.

Was ist RAG?

RAG (Retrieval-Augmented Generation) gibt einem Sprachmodell vor jeder Antwort Zugriff auf Ihre eigenen Dokumente. Ein Retriever holt die relevantesten Ausschnitte, das Modell antwortet ausschließlich auf deren Basis — mit Zitaten und damit prüfbar.

Der Vorteil gegenüber Fine-Tuning: neue Dokumente sind sofort verfügbar (kein Retraining), Halluzinationen sinken drastisch, und Sie behalten die Kontrolle darüber, was das Modell überhaupt sehen darf. Wer welche Antwort bekommt, lässt sich auf Quellenebene steuern — wichtig für vertrauliche Bereiche und Berechtigungsstufen.

Was ist Hybrid Agentic RAG?

Klassisches RAG nutzt einen einzigen Retriever — meist nur Vektor-Suche. Das funktioniert für einfache Faktenfragen, scheitert aber bei komplexen Engineering-Anfragen wie „Welche Steuergeräte beeinflussen die Bremstemperatur in Revision 4.2 und welche DTCs sind neu?“

Hybrid heißt: mehrere Retrieval-Strategien laufen parallel — BM25 für Fachbegriffe, Vektoren für Semantik, GraphRAG für Beziehungen. Reciprocal Rank Fusion vereint die Ergebnisse.
Agentic heißt: ein Agent zerlegt komplexe Fragen, plant mehrere Retrieval-Schritte, prüft Zwischenergebnisse und iteriert. Statt einer einzelnen Antwort entsteht ein nachvollziehbarer Reasoning-Pfad — auditierbar und mit vollständiger Quellenkette.

Warum R.AgenticRAG für meine Firma?

Drei Punkte, die wir liefern und Sie sonst kaum bekommen:

Engineering-native Parser: A2L, ODX, MDF, DBC, PDF-Spezifikationen — schema-bewusst, nicht im generischen Text-Splitter zerhackt. Eine DiagnosticTroubleCode-Definition bleibt als Einheit erhalten, kein Chunk-Break mitten im Freeze-Frame.
On-Premise oder deutsche Cloud: Hetzner, IONOS, Open Telekom Cloud — oder direkt bei Ihnen im Rechenzentrum. Keine US-Hyperscaler, keine Daten-Exfiltration, kein Erklärungsbedarf gegenüber dem Datenschutzbeauftragten.
Eigene Pipeline statt Black-Box-SaaS: R.AgenticRAG basiert auf .NET 9, Lucene.NET und Kùzu. Sie bekommen die Architektur erklärt, nicht nur API-Endpoints. Wartbar, erweiterbar, kein Vendor-Lock-in.

Dazu unser Vorgehen: Erstgespräch → Demo → Pilot → Rollout. Sie entscheiden nach jeder Phase neu, ob wir weitermachen.

Was macht ROSI Technology GmbH?

Wir sind ein deutsches Software-Unternehmen aus Leonberg und entwickeln KI für Engineering und Aftersales, die Ihre Daten nicht aus dem Haus lässt. Kern ist R.AgenticRAG — eine Hybrid-Agentic-RAG-Pipeline, die technische Unterlagen (Steuergeräte-Beschreibungen, Messdaten, Pläne, Spezifikationen) direkt liest und belegbare Antworten mit Quellenangabe liefert.

Wir liefern auf drei Ebenen: als Code-Modul (R.AgenticRAG Core) für Ihr eigenes Team, als Integration (R.AgenticRAG:API) in bestehende Anwendungen, oder als fertige Apps für Engineering und Aftersales. Alles läuft on-premise oder in einer deutschen Cloud — zertifiziert nach ISO 27001 und ISO 9001.

Wieviel würde mich eine Integration in meine Anwendung ca. kosten?

Das hängt vom Umfang ab — von einer schlanken API-Anbindung an ein bestehendes Tool bis zur maßgeschneiderten Anwendung. Als grobe Orientierung:

Integrationen starten typischerweise bei ca. 8.000 € und bewegen sich je nach Umfang im Bereich 8.000–120.000 €.
Individuelle Entwicklung rechnen wir zum Tagessatz ab 920 € ab.

Erstgespräch und eine grobe Datensichtung sind kostenlos — dabei klären wir Datenquellen, Schnittstellen und Zielbild, und Sie bekommen ein belastbares Angebot. Optional setzen wir für wenig Geld einen Proof of Concept auf, mit dem Sie den Nutzen an Ihren eigenen Daten sehen, bevor Sie sich festlegen.

Was ist der Unterschied zwischen Cloud-LLMs und Open-Weight-LLMs?

Cloud-LLMs (z. B. GPT, Claude, Gemini) sind geschlossene Modelle, die Sie nur als Dienst über eine API nutzen. Das Modell läuft auf den Servern des Anbieters — Ihre Anfragen verlassen also Ihr Haus, es gelten fremde Nutzungsbedingungen, API-Kosten und Rate-Limits, und der Anbieter kann das Modell jederzeit ändern oder abschalten.

Open-Weight-LLMs (z. B. Llama, Qwen3, Mistral, DeepSeek, Gemma) stellen ihre Modell-Gewichte öffentlich bereit. Sie betreiben das Modell auf Ihrer eigenen Hardware:

Kein Datenabfluss — kein Token verlässt Ihren Perimeter.
Planbare Kosten statt nutzungsabhängiger API-Gebühren, keine Rate-Limits.
Freie Modellwahl und kein Vendor-Lock-in — das Modell bleibt Ihnen erhalten.

Hinweis: Open-Weight heißt „Gewichte frei verfügbar“ — nicht zwingend vollständig Open Source (Trainingsdaten und -code sind nicht immer offen). Genau auf solche lokal betriebenen Open-Weight-Modelle setzt R.AgenticRAG.

Unterstützt und berät ROSI Technology auch Unternehmen zu KI?

Ja. Neben unserem Produkt begleiten wir Unternehmen auch beratend auf dem Weg zu KI — von der ersten Standortbestimmung über die Auswahl sinnvoller Anwendungsfälle bis zur konkreten Umsetzung. Sie bekommen also nicht nur Software, sondern einen Partner, der Technik und Nutzen zusammenbringt.

Wir arbeiten dabei individuell statt von der Stange — zugeschnitten auf Ihre Branche, Datenlage und Ziele. Schildern Sie uns einfach Ihre Anfrage; das Erstgespräch ist kostenlos.

Kontakt

Lassen Sie uns über Ihre Datenlandschaft sprechen.

Wir hören erst zu, dann zeigen wir, was geht. Kein Pitch-Marathon — ein konkretes Gespräch über Ihre Datenquellen, Sicherheitsanforderungen und Use Cases.

Schreiben Sie uns direkt — wir antworten innerhalb eines Werktages.

sales@rosi-technology.de

ROSI · Engineered in Germany
Vertraulich · NDA vor jeder Demo möglich

Maxi, Ihr persönlicher Ansprechpartner im Vertrieb bei ROSI — Maxi Ihr persönlicher Ansprechpartner · Vertrieb
„Erzählen Sie mir von Ihren Datenquellen und Use Cases — gemeinsam finden wir den schnellsten Weg zur passenden Lösung. Unkompliziert, ehrlich und ohne Pitch-Marathon.“
Mit Maxi schreiben

Schreiben Sie uns

Pflichtfelder sind mit * markiert.

Name * Firma E-Mail * Telefon Ihre Nachricht *

Wir antworten innerhalb eines Werktages.

Die KI, die Ihre Engineering-Daten versteht — und nie das Haus verlässt.

Ihre Daten bleiben bei Ihnen

Geprüfte Qualität & Sicherheit

Findet Antworten wie ein Experte

Antworten, die Sie nachvollziehen können

Versteht Ihre Engineering-Daten

Baut auf Ihre Software auf

Ihre Frage

Ihre Unterlagen

Belegte Antwort

Wir gehen weiter: Agentic Hybrid RAG

Hybrid-Suche

Agentisch

Chatbasierter KI-Assistent

Diagnose-Resultat-Explorer & Analyzer

Customer-Specific Assistant

Feldbeobachtung

Sporadischer Drehmomenteinbruch bei Lastwechsel über 6.000 1/min

R.AgenticRAG

Maximale Datenhoheit

Hybrid & leistungsstark

Vollständig gemanagt

Erstgespräch

Machbarkeit & Demo

Pilotphase

Integration & Rollout

Betrieb & Weiterentwicklung

Dr.-Ing. Michael Grimm

Dr.-Ing. Kordian Komarek

Moch

Verbindung wird wiederhergestellt …

Verbindung unterbrochen

Sitzung abgelaufen