Liikuge tooteteabe juurde
1 of 7

Kentino sro

K-AI 576 Genoa RTXPro6000MQ 12000TOPS — 6× RTX Pro 6000 Blackwell Max-Q AI Frontier server

K-AI 576 Genoa RTXPro6000MQ 12000TOPS — 6× RTX Pro 6000 Blackwell Max-Q AI Frontier server

Tavahind EUR € 106.069,00
Tavahind müügihind EUR € 106.069,00
Soodusmüük Välja müüdud
Sisaldab maksu. Transport TASUTA Arvutatakse kassas.

K-AI 576 Genoa RTXPro6000MQ 12000TOPS

576 GB ECC VRAM Frontier Server
6x RTX Pro 6000 Max-Q turboventilaator | EPYC Genoa | 12 000 TOPS INT8

12 000
TOPS INT8
576 GB
ECC VRAM-i bassein
Gen5
Broadcomi lüliti
Vaikne
turboventilaatori jahutus

Avaldatud välised viited. Kentino riistvaral ei ole mõõdetud.

7U riiulile paigaldatav piiritaseme järeldusplatvorm kuue NVIDIA RTX Pro 6000 Blackwell Max-Q turboventilaatorkaardiga, mis on ühendatud 576 GB ECC videomäluga, ühe AMD EPYC 9354 Genoa protsessoriga (32C/64T), 768 GB DDR5-4800 ECC-ga (kõik 12 kanalit asustatud), 4 TB NVMe alglaadimismäluga ja 5 × 1200 W serveri toiteplokiga. Sama räni ja mälumaht nagu passiivsel Server Editioni versioonil – erinev jahuti. Max-Q turboventilaator on iga kaardi kohta iseseisev, töötab vaiksemalt ja talub leebemat šassii õhuvoolu. Identne mudeliümbris oma passiivse vennaga.

riistvara

Komponent detail
GPU 6x NVIDIA RTX Pro 6000 Blackwell Max-Q 96 GB ECC (turboventilaator, 600 W TDP spetsifikatsioon, PCIe 5.0 x16, 2000 INT8 TOPS kaardi kohta)
VRAM-i bassein 576 GB kokku 6 kaardil (ilma NVLinkita — P2P PCIe Gen5 kaudu kiirusel ~55–60 GB/s suuna kohta)
Protsessor AMD EPYC 9354 Genoa (32C/64T, 280 W, 128x PCIe 5.0 rajad, 12-kanaliline DDR5)
Emaplaat ASRock Rack GENOAD8X-2T/BCM (SP5 Genoa, integreeritud Broadcom PEX PCIe Gen5 lüliti, 12x DDR5, 2x 10 GbE, IPMI)
Süsteemi RAM 768 GB DDR5-4800 ECC RDIMM (12x 64 GB — kõik kanalid täis, kokku ~460 GB/s)
Saapa/panipaik 4 TB NVMe M.2 (PCIe 4.0 x4) – piiripunktide jaoks mõeldud suurusega
Toiteallikas 5x 1200 W serveri toiteploki komplekt (HP-ühilduv, kokku 6 kW)
Šassii 7U 8-GPU rackmount, 10 PCIe pesa mahutavusega, aktiivsed Gen5 tõstjad
Jahutus SP5 Genoa tornjahuti + 8 x 120 mm korpuseventilaatorid. Graafikaprotsessoripõhised turboventilaatorid on iseseisvad – andmekeskuse õhuvool on soovitatav, kuid mitte rangelt nõutav. Laborikeskkondadesse vaiksem.
võrk Sisseehitatud kahekordne 10 GbE (Intel X550)

Võimsusümbris

  • Graafikaprotsessori energiatarve (spetsifikatsioon): 6 x 600 W = 3600 W
  • Süsteemi koguvõimsus täiskoormusel: ~4080 W
  • Toiteploki koguvõimsus: 6000 W (5x 1200 W) — 32% reservruumi
  • Max-Q kaardid töötavad tavaliselt 520–550 W püsivalt – tegelik võimsusvaru on üle 20%.

Jahutus (Max-Q diferentseeriv tegur)

Iga kaart imeb õhku eest taha oma puhuri kaudu – iga kaart eraldi. Talub sega-riiuli/avatud korpuse paigaldamist. Vaiksem kui samaväärne aksiaalventilaatoritega virn. Max-Q püsivara profiil soosib madalamat püsivat energiatarvet (tüüpiliselt 520–550 W). Soovitatav: kapp perforeeritud eesmise ukse ja selge tagumise väljatõmbekanaliga.

Mida sa joosta saad

Identne Server Editioni sugulasega – sama kiibistik, sama 576 GB mälumaht. DeepSeek V3 Q4 (~404 GB) pika kontekstiga, Kimi-K2 Q2, Mistral Large 3 Q2-Q3, GLM-5 Q2, Qwen3-Coder-480B Q4.

LLM-id — tekst / arutluskäik / kodeerimine

Hiina piir

  • DeepSeek V3 / R1 / V3.1 / V3.2 Q4_K_M-is (~404 GB) on mugav pika kontekstiga (~5-8 tok/s üksik vLLM TP-6, avaldatud viide); fp8 natiivne (~670 GB RAM-i hajumisega)
  • Kimi-K2 (Baas / Juhendamine / Mõtlemine) Q2_K-s (~375 GB) mugav (~5-8 tok/s üksik, avaldatud viide)
  • GLM-5 / GLM-5.1 (~745B/44B) Q2_K juures (~260 GB); Q3 (~420 GB) koos RAM-i ülekandmisega
  • Qwen3-Coder-480B-A35B Q4_K_M-is (~270 GB) pika kontekstiga
  • Qwen3-235B-A22B bf16 (~470 GB) või fp8 (~240 GB) juures
  • ERNIE-4.5-424B-A47B 4. kvartalis (~240 GB) 128k CTX-ga
  • Intern-S1-Pro Q2_K juures (~325 GB); Hunyuan-Large 4. kvartalis (~220 GB)
  • MiniMax-Text-01 / M1 4. kvartalis (~260 GB)

Läänepiir

  • Mistral Suur 3 Q2-Q3-s (~243-317 GB) mugav (~20-30 tok/s üksikult, avaldatud viide)
  • Leek 4 Maverick Q4_K_M-is (~232 GB) pika ctx-ga (~45-55 tok/s üksik, avaldatud viide)
  • Llama-3.1-Nemotron Ultra 253B 8. kaadrisagedusel (~253 GB)
  • Grok-1 314B neljandas kvartalis (~182 GB); Lumehelbe Arktika 4. kvartalis (~278 GB)
  • DBRX-i juhis 132B/36B bf16 (~264 GB) või fp8 juures

Nägemis-keele mudelid

Qwen3-VL-235B-A22B; InternVL3.5-241B-A28B Q4; GLM-4.5V / 4.6V 106B bf16; Llama 3.2 90B Vision bf16; Pixtral Large 124B fp8; Molmo 72B bf16.

Pildi genereerimine

HunyuanImage-3.0 Instruct; FLUX.1 [dev] / [schnell] / Kontext mitme eksemplariline (~15-20 sekundit 1024x1024 pildi kohta, avaldatud viide); SD 3.5 Large; SDXL; AuraFlow; OmniGen; HunyuanImage-2.1; Kolors 2.0.

Video genereerimine

Wan 2.2 T2V-A14B kahe eksperdiga MoE bf16; HunyuanVideo 13B bf16; Open-Sora 2.0 (11B); Mochi-1 (10B); NVIDIA Cosmos Predict 2 kuni 14B; CogVideoX-5B; LTX-Video; Pyramid Flow.

Heli / kõne / TTS

Täiskomplekti resident: Whisper v3 large, Parakeet-TDT 1.1B, Canary 1B, Moshi 7B realtime, Qwen3-Omni, Step-Audio R1, CosyVoice 3.0, Kokoro, Stable Audio Open.

Mitme mudeli / mitme üürniku teenindus

  • DeepSeek V3 Q4 + FLUX + HunyuanVideo + Whisper/Moshi reaalajas kõik elanikud
  • Samaaegne 70B tensor-paralleel + 235B-MoE eraldi PCIe domeenidel
  • 3 A/B-hindamise jaoks residentset piirimudelit

Sihtkoormused

  • Avatud raskusega piiripealne uurimislabor segatud/mitteideaalse õhuvooluga infrapunaga
  • Kolokeerimine / privaatne andmekeskus, kus kaardipõhine turboventilaator on töökorras lihtsam kui täielik passiivne õhuvool
  • Suveräänse tehisintellekti juurutamine Apache 2.0 / MIT mudelipaketiga
  • Ettevõtte mitme mudeli RAG + agentide platvorm
  • Laborikeskkonnad avatud riiulitega

Avaldatud toimivuse viited

Välised viited | Sama silikoon mis Server Editionil | Kentino riistvaral ei ole mõõdetud

võrrelda Tulemus
RTX Pro 6000 kaardi kohta INT8 TOPS 2 000 TOPSi
vLLM – DeepSeek V3 Q4 6x RTX Pro 6000-l (üksik) ~25–40 tokki/s
vLLM – DeepSeek V3 Q4 6x RTX Pro 6000-l (partii-32) 200–400 tok/s agregaat
FLUX.1 [arendaja] fp8 ühe RTX Pro 6000 peal ~15–20 sekundit 1024x1024 pildi kohta

Täpsed arvud kinnitatakse PoC etapis. Kentino avaldab esimese osapoole arvud pärast esialgset kliendikogemuse kogumist.

Pole ideaalne

  • Kimi-K2 / DeepSeek V3 reaalajas neljandas kvartalis tootmisserveris – samm edasi K-AI 768 TurinDual RTXPro6000MQ-ni
  • Treenimine nullist tipptasemel mudelitel – NVLinki pole vaja
  • Lihtne plug-and-play juurutamine – piiriülene moodulite teenindus vajab oskuslikku MLOps meeskonda

Garantii ja tarneaeg

2 aastat
varuosade garantii
1 aasta
töögarantii
10-28 päeva
ettevalmistusaeg

Ehitus hõlmab kokkupanekut, BIOS-i konfigureerimist, draiveri installimist, sisestamist arvutisse, memtestimist, funktsionaalsuse kontrollimist ja LLM-keskkonna seadistamist. Tarneaeg sõltub komponentide saadavusest, mis kinnitatakse tellimuse esitamisel.

Soovitatavad lisandmoodulid

  • NVIDIA ConnectX-5 MCX555A-ECAT 100 GbE võrgukaart mitmesõlmeliseks skaleerimiseks
  • Teine 4 TB NVMe andmestiku/mudeli teegi jaoks
  • Täismahus 24U rack-kapp perforeeritud esiuksega
  • Võrgupõhine UPS 10 kVA
  • Hallatud PDU
Vaata kõiki üksikasju