Zürcher Nachrichten - Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

EUR -
AED 4.31478
AFN 74.004506
ALL 95.536367
AMD 437.674378
ANG 2.102543
AOA 1078.356798
ARS 1614.872288
AUD 1.642906
AWG 2.117362
AZN 2.005382
BAM 1.953199
BBD 2.36566
BDT 144.119334
BGN 1.959488
BHD 0.443074
BIF 3484.690971
BMD 1.174681
BND 1.493518
BOB 8.116193
BRL 5.850043
BSD 1.174541
BTN 109.764317
BWP 15.7471
BYN 3.331578
BYR 23023.746175
BZD 2.362265
CAD 1.60526
CDF 2718.212235
CHF 0.917075
CLF 0.026646
CLP 1048.73105
CNY 8.013262
CNH 8.020733
COP 4214.038612
CRC 534.290873
CUC 1.174681
CUP 31.129045
CVE 110.860503
CZK 24.323293
DJF 208.764555
DKK 7.473414
DOP 70.603092
DZD 155.255871
EGP 60.794554
ERN 17.620214
ETB 184.366266
FJD 2.581772
FKP 0.86755
GBP 0.86991
GEL 3.159855
GGP 0.86755
GHS 12.997834
GIP 0.86755
GMD 86.341846
GNF 10307.825121
GTQ 8.977047
GYD 245.73281
HKD 9.199038
HNL 31.270327
HRK 7.535229
HTG 153.805864
HUF 363.939917
IDR 20132.856413
ILS 3.5298
IMP 0.86755
INR 109.976624
IQD 1538.244674
IRR 1551753.504557
ISK 143.827947
JEP 0.86755
JMD 186.063051
JOD 0.83285
JPY 187.211307
KES 151.657865
KGS 102.724083
KHR 4711.645416
KMF 493.365648
KPW 1057.195678
KRW 1743.955123
KWD 0.361916
KYD 0.978801
KZT 545.37616
LAK 25772.499635
LBP 105539.907837
LKR 371.788638
LRD 216.464335
LSL 19.405575
LTL 3.468527
LVL 0.710553
LYD 7.424117
MAD 10.871086
MDL 20.202187
MGA 4863.179349
MKD 61.641375
MMK 2466.753322
MNT 4201.994099
MOP 9.473826
MRU 46.999277
MUR 54.457746
MVR 18.160778
MWK 2040.421046
MXN 20.344653
MYR 4.641211
MZN 75.056888
NAD 19.417809
NGN 1582.600708
NIO 43.122114
NOK 11.009943
NPR 175.622908
NZD 1.992676
OMR 0.451673
PAB 1.174536
PEN 4.037967
PGK 5.120728
PHP 70.664055
PKR 327.620448
PLN 4.240892
PYG 7469.086798
QAR 4.282302
RON 5.099874
RSD 117.410477
RUB 88.253724
RWF 1715.621494
SAR 4.405541
SBD 9.442992
SCR 16.950003
SDG 704.808354
SEK 10.796849
SGD 1.496075
SHP 0.877018
SLE 28.896753
SLL 24632.467201
SOS 671.332137
SRD 44.018235
STD 24313.523524
STN 24.844502
SVC 10.27736
SYP 129.851561
SZL 19.399863
THB 37.859709
TJS 11.0406
TMT 4.117257
TND 3.367221
TOP 2.82835
TRY 52.774066
TTD 7.964429
TWD 36.997515
TZS 3065.917411
UAH 51.817726
UGX 4351.206424
USD 1.174681
UYU 46.697822
UZS 14201.892447
VES 565.076472
VND 30929.348816
VUV 138.683646
WST 3.190394
XAF 655.087548
XAG 0.015323
XAU 0.000249
XCD 3.174634
XCG 2.116782
XDR 0.814719
XOF 653.122368
XPF 119.331742
YER 280.308247
ZAR 19.368259
ZMK 10573.549249
ZMW 22.345343
ZWL 378.246779
  • EUR/USD

    0.0001

    1.1744

    +0.01%

  • MDAX

    -157.3900

    31347.93

    -0.5%

  • DAX

    -146.9300

    24270.87

    -0.61%

  • Euro STOXX 50

    -52.3800

    5930.25

    -0.88%

  • TecDAX

    -11.1300

    3700.23

    -0.3%

  • SDAX

    52.9000

    18131.02

    +0.29%

  • Goldpreis

    25.7000

    4745.3

    +0.54%

Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen
Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

Von Edge-Inferenz bis NVIDIA STX: speziell entwickelte KV-Cache-Infrastruktur für konsistente Leistung in großem Maßstab.

Textgröße:

SUNNYVALE, CA / ACCESS Newswire / 21. April 2026 / Graid Technology, der Pionier im Bereich GPU-beschleunigter NVMe-Speicher, hat heute sein Agentic AI Storage Portfolio vorgestellt: eine speziell entwickelte Familie von KV-Cache-Lösungen, die darauf ausgelegt ist, den Speicherengpass zu beseitigen, der „Always-on"-Produktions-KI ausbremst. Das Portfolio umfasst drei Bereitstellungsebenen: KV-Cache-Server, KV-Cache-Rack und KV-Cache-Plattform, die alle auf der SupremeRAID™-Technologie basieren. Die KV-Cache-Plattform, die höchste Stufe des Portfolios, ist auf die STX-Referenzarchitektur von NVIDIA abgestimmt, wobei die native BlueField-4-DPU-Ausführung für das zweite Halbjahr 2026 geplant ist.

Da agentische KI vom Experimentierstadium in die Produktion übergeht, haben sich die Infrastrukturannahmen, die der Single-Shot-Inferenz zugrunde lagen, als unhaltbar erwiesen. Modelle, die kontinuierliche mehrstufige Aufgaben ausführen und den Kontext über stundenlangen Betrieb hinweg aufrechterhalten, erzeugen KV-Cache-Anforderungen, die den GPU-HBM überlasten. Die Folge: Latenzspitzen von bis zu 18-fach, eine GPU-Auslastung von nur 50 % sowie Fehler auf Modellebene, darunter Halluzinationen und eine Verschlechterung der Schlussfolgerungsfähigkeit, die schwer zu erkennen und kostspielig zu beheben sind.

SupremeRAID™geht dieses Problem direkt an, indem es bis zu 32 NVMe-Laufwerke zu einem einzigen virtuellen Pool mit 280 GB/s bündelt, die CPU über GPU Direct Storage umgeht und KV-Cache-Lesevorgänge mit 1,3 ms liefert - 77-mal schneller als bei Standard-NVMe. Die drei Portfolio-Stufen machen diese Fähigkeit für jede Bereitstellungsgröße verfügbar:

KV-Cache-Server - NVMe-Beschleunigung auf Einzelknotenebene für einzelne Inferenzserver und Edge-AI-Bereitstellungen. Ab sofort verfügbar.

KV-Cache-Rack - Rack-Scale-Lösungen, die von Partnern validiert und gemeinsam mit führenden Server-OEM-Partnern für Multi-GPU-Cluster in Unternehmen entwickelt wurden. Jetzt verfügbar.

KV-Cache-Plattform - Speziell für die STX-Referenzarchitektur von NVIDIA entwickelt, mit nativer BlueField-4-DPU-Ausführung und einer auf Rack-Ebene skalierbaren Speichererweiterung in der Roadmap.

„Vor einem Jahr, auf der GTC 2025, prognostizierte Jensen Huang, dass Speicher erstmals GPU-beschleunigt werden würde. In diesem Jahr hat NVIDIA dieses Konzept mit STX und CMX in eine Architektur umgesetzt", sagte Leander Yu, CEO von Graid Technology. „Unser KV-Cache-Portfolio ist genau für diesen Moment konzipiert und liefert die Speicherleistung, die agentische KI erfordert, und das zu den Kosten einer Speicherebene."

Für Unternehmen und Infrastrukturteams, die den Einsatz von agentischer KI evaluieren, sind die vollständige Bereitstellungsarchitektur, technische Spezifikationen und Details zur NVIDIA STX-Kompatibilität im Solution Brief verfügbar: Graid Technology Agentic AI Storage Portfolio: Speziell entwickelte KV-Cache-Lösungen für Inferenz in großem Maßstab

Weitere Informationen zu den KI-Angeboten von Graid Technology finden Sie unter graidtech.com/ai

Medienanfragen:

Andrea Eaken, Sr. Direktor für Marketing, Americas & EMEA

[email protected]

____________________________________

Über Graid Technology

Graid Technology entwickelt die Speicherinfrastruktur für die Zukunft von KI, Unternehmen und Hochleistungsrechnen. Als Entwickler von SupremeRAID™, dem weltweit ersten und einzigen GPU-basierten RAID, und als globaler Verfechter von Intel® Virtual RAID on CPU (Intel® VROC) bietet Graid Technology flexible RAID-Lösungen, die die NVMe-Leistung maximieren und gleichzeitig einen ausfallsicheren, skalierbaren Datenschutz für moderne Dateninfrastrukturen gewährleisten. Graid Technology hat seinen Hauptsitz im Silicon Valley und verfügt über weltweite Niederlassungen sowie Forschungs- und Entwicklungszentren in Taiwan. Das Unternehmen treibt RAID-Innovationen für die nächste Generation datenintensiver Workloads voran. Weitere Informationen finden Sie unter graidtech.com.

QUELLE: Graid Technology Inc.

J.Hasler--NZN