Zürcher Nachrichten - Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

EUR -
AED 4.179607
AFN 72.258895
ALL 94.205288
AMD 419.32538
ANG 2.037333
AOA 1043.471931
ARS 1673.878652
AUD 1.646164
AWG 2.049676
AZN 1.931828
BAM 1.955918
BBD 2.296329
BDT 140.068478
BGN 1.924085
BHD 0.43002
BIF 3405.606125
BMD 1.137919
BND 1.476989
BOB 7.895478
BRL 5.920364
BSD 1.140164
BTN 107.948534
BWP 15.503938
BYN 3.202194
BYR 22303.209908
BZD 2.293039
CAD 1.616971
CDF 2577.385877
CHF 0.922079
CLF 0.026365
CLP 1037.657169
CNY 7.709175
CNH 7.735322
COP 3899.04488
CRC 517.224487
CUC 1.137919
CUP 30.15485
CVE 110.271674
CZK 24.228625
DJF 202.230987
DKK 7.475001
DOP 66.733159
DZD 152.068092
EGP 56.580855
ERN 17.068783
ETB 183.814318
FJD 2.561791
FKP 0.85899
GBP 0.86289
GEL 3.009787
GGP 0.85899
GHS 12.797775
GIP 0.85899
GMD 83.067764
GNF 9990.121794
GTQ 8.698526
GYD 238.534437
HKD 8.922706
HNL 30.504712
HRK 7.534161
HTG 149.069022
HUF 355.706046
IDR 20399.24405
ILS 3.40957
IMP 0.85899
INR 107.8111
IQD 1493.5904
IRR 1564638.450732
ISK 144.003725
JEP 0.85899
JMD 179.470074
JOD 0.806818
JPY 183.853426
KES 147.258242
KGS 99.511194
KHR 4575.854724
KMF 490.443242
KPW 1024.127384
KRW 1745.914618
KWD 0.351594
KYD 0.950158
KZT 554.603568
LAK 25248.528174
LBP 102099.879625
LKR 381.463088
LRD 207.502559
LSL 18.801338
LTL 3.359979
LVL 0.688316
LYD 7.316411
MAD 10.671146
MDL 20.072215
MGA 4763.288299
MKD 61.63521
MMK 2388.932514
MNT 4072.611663
MOP 9.207457
MRU 45.285348
MUR 54.57472
MVR 17.592561
MWK 1977.010972
MXN 20.012811
MYR 4.711558
MZN 72.710706
NAD 18.801338
NGN 1558.857449
NIO 41.952539
NOK 11.148254
NPR 172.716695
NZD 2.008275
OMR 0.437534
PAB 1.140169
PEN 3.859434
PGK 5.000325
PHP 69.924546
PKR 317.102593
PLN 4.285607
PYG 6950.390134
QAR 4.156252
RON 5.247057
RSD 117.351293
RUB 84.774961
RWF 1671.993851
SAR 4.273217
SBD 9.177362
SCR 15.231046
SDG 683.318583
SEK 11.088575
SGD 1.476194
SHP 0.849571
SLE 28.163574
SLL 23861.593974
SOS 651.636577
SRD 42.652585
STD 23552.623219
STN 24.500299
SVC 9.976604
SYP 125.77656
SZL 18.795138
THB 37.854581
TJS 10.57484
TMT 3.994095
TND 3.374904
TOP 2.739836
TRY 52.886538
TTD 7.741469
TWD 36.036527
TZS 2987.455785
UAH 51.179898
UGX 4173.252587
USD 1.137919
UYU 45.732768
UZS 13698.829126
VES 701.942638
VND 29955.714328
VUV 135.137568
WST 3.136474
XAF 655.993822
XAG 0.018439
XAU 0.000276
XCD 3.075283
XCG 2.054824
XDR 0.815849
XOF 655.993822
XPF 119.331742
YER 271.564061
ZAR 18.840509
ZMK 10242.636979
ZMW 20.453238
ZWL 366.409413
  • SDAX

    -238.4700

    18157

    -1.31%

  • TecDAX

    -67.0900

    3903.86

    -1.72%

  • Euro STOXX 50

    -80.7700

    6230.55

    -1.3%

  • Goldpreis

    -61.2000

    4141.5

    -1.48%

  • DAX

    -246.1100

    24893.58

    -0.99%

  • MDAX

    -445.3600

    32129.1

    -1.39%

  • EUR/USD

    -0.0048

    1.1383

    -0.42%

Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen
Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

Graid Technology bringt ein agentenbasiertes KI-Speicherportfolio auf den Markt, um Engpässe bei KV-Caches zu beseitigen

Von Edge-Inferenz bis NVIDIA STX: speziell entwickelte KV-Cache-Infrastruktur für konsistente Leistung in großem Maßstab.

Textgröße:

SUNNYVALE, CA / ACCESS Newswire / 21. April 2026 / Graid Technology, der Pionier im Bereich GPU-beschleunigter NVMe-Speicher, hat heute sein Agentic AI Storage Portfolio vorgestellt: eine speziell entwickelte Familie von KV-Cache-Lösungen, die darauf ausgelegt ist, den Speicherengpass zu beseitigen, der „Always-on"-Produktions-KI ausbremst. Das Portfolio umfasst drei Bereitstellungsebenen: KV-Cache-Server, KV-Cache-Rack und KV-Cache-Plattform, die alle auf der SupremeRAID™-Technologie basieren. Die KV-Cache-Plattform, die höchste Stufe des Portfolios, ist auf die STX-Referenzarchitektur von NVIDIA abgestimmt, wobei die native BlueField-4-DPU-Ausführung für das zweite Halbjahr 2026 geplant ist.

Da agentische KI vom Experimentierstadium in die Produktion übergeht, haben sich die Infrastrukturannahmen, die der Single-Shot-Inferenz zugrunde lagen, als unhaltbar erwiesen. Modelle, die kontinuierliche mehrstufige Aufgaben ausführen und den Kontext über stundenlangen Betrieb hinweg aufrechterhalten, erzeugen KV-Cache-Anforderungen, die den GPU-HBM überlasten. Die Folge: Latenzspitzen von bis zu 18-fach, eine GPU-Auslastung von nur 50 % sowie Fehler auf Modellebene, darunter Halluzinationen und eine Verschlechterung der Schlussfolgerungsfähigkeit, die schwer zu erkennen und kostspielig zu beheben sind.

SupremeRAID™geht dieses Problem direkt an, indem es bis zu 32 NVMe-Laufwerke zu einem einzigen virtuellen Pool mit 280 GB/s bündelt, die CPU über GPU Direct Storage umgeht und KV-Cache-Lesevorgänge mit 1,3 ms liefert - 77-mal schneller als bei Standard-NVMe. Die drei Portfolio-Stufen machen diese Fähigkeit für jede Bereitstellungsgröße verfügbar:

KV-Cache-Server - NVMe-Beschleunigung auf Einzelknotenebene für einzelne Inferenzserver und Edge-AI-Bereitstellungen. Ab sofort verfügbar.

KV-Cache-Rack - Rack-Scale-Lösungen, die von Partnern validiert und gemeinsam mit führenden Server-OEM-Partnern für Multi-GPU-Cluster in Unternehmen entwickelt wurden. Jetzt verfügbar.

KV-Cache-Plattform - Speziell für die STX-Referenzarchitektur von NVIDIA entwickelt, mit nativer BlueField-4-DPU-Ausführung und einer auf Rack-Ebene skalierbaren Speichererweiterung in der Roadmap.

„Vor einem Jahr, auf der GTC 2025, prognostizierte Jensen Huang, dass Speicher erstmals GPU-beschleunigt werden würde. In diesem Jahr hat NVIDIA dieses Konzept mit STX und CMX in eine Architektur umgesetzt", sagte Leander Yu, CEO von Graid Technology. „Unser KV-Cache-Portfolio ist genau für diesen Moment konzipiert und liefert die Speicherleistung, die agentische KI erfordert, und das zu den Kosten einer Speicherebene."

Für Unternehmen und Infrastrukturteams, die den Einsatz von agentischer KI evaluieren, sind die vollständige Bereitstellungsarchitektur, technische Spezifikationen und Details zur NVIDIA STX-Kompatibilität im Solution Brief verfügbar: Graid Technology Agentic AI Storage Portfolio: Speziell entwickelte KV-Cache-Lösungen für Inferenz in großem Maßstab

Weitere Informationen zu den KI-Angeboten von Graid Technology finden Sie unter graidtech.com/ai

Medienanfragen:

Andrea Eaken, Sr. Direktor für Marketing, Americas & EMEA

[email protected]

____________________________________

Über Graid Technology

Graid Technology entwickelt die Speicherinfrastruktur für die Zukunft von KI, Unternehmen und Hochleistungsrechnen. Als Entwickler von SupremeRAID™, dem weltweit ersten und einzigen GPU-basierten RAID, und als globaler Verfechter von Intel® Virtual RAID on CPU (Intel® VROC) bietet Graid Technology flexible RAID-Lösungen, die die NVMe-Leistung maximieren und gleichzeitig einen ausfallsicheren, skalierbaren Datenschutz für moderne Dateninfrastrukturen gewährleisten. Graid Technology hat seinen Hauptsitz im Silicon Valley und verfügt über weltweite Niederlassungen sowie Forschungs- und Entwicklungszentren in Taiwan. Das Unternehmen treibt RAID-Innovationen für die nächste Generation datenintensiver Workloads voran. Weitere Informationen finden Sie unter graidtech.com.

QUELLE: Graid Technology Inc.

J.Hasler--NZN