KI-Hardware-Rechner
Dimensionierung Ihrer lokalen Infrastruktur.
Lokalen KI-Server richtig dimensionieren
Mit diesem Rechner erhalten Sie eine erste, belastbare Empfehlung für lokale KI-Infrastruktur in Deutschland und Europa. Statt pauschaler Schätzungen berücksichtigt der Rechner Ihren echten Einsatz: parallele Nutzer, gewünschte Antwortgeschwindigkeit, Datensensitivität und dokumentenlastige Workloads. Das Ergebnis zeigt Ihnen nicht nur eine Größenklasse, sondern auch eine sinnvolle Plattformrichtung und einen Budgetkorridor.
Für regulierte Umgebungen (z. B. Kanzlei, Praxis, Finanz- oder Industrieprozesse) hilft die Einschätzung dabei, On-Prem KI planbar und DSGVO-konform zu starten - ohne Überprovisionierung. Die Empfehlung ersetzt kein finales Architekturreview, reduziert aber Fehlentscheidungen in der frühen Planungsphase deutlich.
Use Case auswählenWählen Sie einfach alles aus, was Ihr Team wirklich täglich macht.
Wofür möchten Sie die lokale KI hauptsächlich nutzen?
FAQ zum KI-Hardware-Rechner
Wie genau ist die Empfehlung?
Die Empfehlung ist eine belastbare Erstabschätzung auf Basis Ihrer Angaben. Für finalen Einkauf sollten Sie einen Architektur-Check mit realen Testlasten durchführen.
Ist das für DSGVO-relevante Daten geeignet?
Ja, der Rechner ist speziell auf lokale/on-prem Szenarien ausgelegt. Für produktiven Betrieb sind zusätzlich Rollenrechte, Logging und Sicherheitsrichtlinien wichtig.
Brauche ich sofort mehrere GPUs?
Nicht immer. Viele Teams starten mit einer kleineren Konfiguration und skalieren bei steigender Parallelität oder strengeren Latenzanforderungen.
Kann ich Cloud und On-Prem kombinieren?
Ja. Ein hybrides Modell ist oft sinnvoll: sensible Prozesse lokal, unkritische Lasten optional in der Cloud - je nach Compliance-Vorgaben.
Wie wir berechnen
VRAM = Modellgewichte (nach Quantisierung) + KV-Cache × Kontext × Nutzer. Ein 7B-Modell in Q4 belegt ca. 4 GB; längere Kontexte addieren pro Nutzer 0,5–16 GB.
Geschwindigkeit: Jede Quantisierungsstufe skaliert relativ zu Q4 — Q5 ≈ 92 %, Q8 ≈ 78 %, FP16 ≈ 62 % der Q4-Geschwindigkeit für LLMs. Video-Modelle skalieren umgekehrt (höhere Präzision = mehr Sekunden pro Clip).
Strom = TDP (W) × Nutzungsstunden × 30 Tage ÷ 1.000 × Stromtarif. Der Tarif stammt aus Ihrem gewählten Land.
TCO (Total Cost of Ownership) = Hardware ÷ 3 Jahre Abschreibung + jährliche Stromkosten.