Kentino sro
K-AI 256 TurinDual 5090 — 8× RTX 5090 kahe pesaga Zen5c lipulaev (küsi protsessori hinnapakkumist)
K-AI 256 TurinDual 5090 — 8× RTX 5090 kahe pesaga Zen5c lipulaev (küsi protsessori hinnapakkumist)
无法加载取货服务可用情况
K-AI 256 TurinDual 5090 13408TOPS
256 GB videomäluga lipulaevjäreldusserver
8x RTX 5090 | Kahekordne EPYC Torino | 13 408 TOPS INT8
Protsessori hinnakujundus vormistati tellimuse esitamisel – Torino 9005-seeria turg liigub 2026. aasta teises kvartalis igal nädalal.
Avaldatud välised viited. Kentino riistvaral ei ole mõõdetud.
7U riiulile paigaldatav lipulaev-inferentsiaalserver kaheksa GeForce RTX 5090 graafikakaardiga (32 GB GDDR7, Blackwell, natiivne fp8) kahe pesaga EPYC Turin (Zen5c, SP5) platvormil, 768 GB DDR5-4800 ECC-ga kõigil 12 kanalil, 2 TB NVMe alglaadimismälu ja 5 × 1200 W serveri toiteplokiga. Ots-otsa PCIe Gen5 ühendus graafikakaardil aktiivsete retimer/rediiver riserite kaudu. Käitab vLLM-i, SGLangi, llama.cpp-i, ComfyUI-d ja kõiki peamisi avatud kaaluga inferentsiaalpinu koheselt.
riistvara
| Komponent | detail |
|---|---|
| GPU | 8x NVIDIA GeForce RTX 5090 32 GB GDDR7 (Blackwell, 575 W TGP, PCIe 5.0 x16, natiivne fp8, 1676 INT8 TOPS/kaart) |
| VRAM-i bassein | 256 GB kokku 8 kaardil (tarbijale mõeldud RTX 5090 puhul NVLinki pole) |
| Protsessor | 2x AMD EPYC Turin 9005-seeria (Zen5c, SP5, PCIe 5.0) — tellimuse esitamisel hinnapakkumine ootel |
| Emaplaat | ASRock Rack TURIN2D24XGM/500W (kahekordne SP5, PCIe 5.0, 24x DDR5 DIMM) |
| Süsteemi RAM | 768 GB DDR5-4800 ECC RDIMM (12x 64 GB — kõik 12 kanalit täidetud; 12 pesa on alles skaleerimiseks 1.5 TB-ni) |
| Saapa/panipaik | 2 TB NVMe M.2 (PCIe 4.0 x4) |
| Toiteallikas | 5x 1200 W serveri toiteploki komplekt (HP-ühilduv, 6 kW agregaat) |
| Šassii | 7U 8-GPU (kuni 10 PCIe pesa, eraldi toiteploki pesad) |
| Jahutus | 2x SP5 tornjahutit + riiulile paigaldatav eest taha suunatud õhuvool (tööstuslikud ventilaatorid) |
| JUHTRAUA KÕRGENDUSED | 8x aktiivset PCIe Gen5 x16 (retimer/redriver) – otsast lõpuni Gen5 |
| võrk | Emaplaadil olev 10 GbE (sõltub emaplaadist) |
Võimsusümbris
- Graafikaprotsessori energiatarve: 8 x 575 W = 2400 W
- Süsteemi koguvõimsus täiskoormusel: ~1825 W
- Toiteploki koguvõimsus: 6000 W (5x 1200 W) — 8% varu spetsifikatsiooni järgi
- Kentino graafikakaardi võimsuspiirang on 500 W – koguvõimsus langeb ~4920 W-ni (~15% võimsusvaru).
Raja topoloogia
Dual Turin pakub hosti poolel 2x 128 = 256 PCIe Gen5 rada. Aktiivsed Gen5 riserid kannavad iga graafikakaardi puhul ots-otsa Gen5 x16 rada – PCIe lülitit pole vaja (üks protsessor 4-kaardilise panga kohta). NVLink puudub; graafikakaartidevaheline P2P Gen5 x16 radadel (~60 GB/s nominaalne lingi kohta).
Mida sa joosta saad
256 GB koondatud videomäluga kaheksal Blackwelli kaardil, millel on natiivne fp8, on see server suunatud neljandas kvartalis reaalse konteksti korral piiripealse 235-480B MoE-le, teises kvartalis DeepSeek V3 perekonnale ja reaalse läbilaskevõimega Kimi-K2 1.58-bitisele dünaamilisele kvantmälule.
LLM-id — tekst / arutluskäik / kodeerimine
Hiina piir
- Qwen3-235B-A22B (Instruct / Thinking / "2507") Q4 (~132 GB) pika konteksti ja mitme kasutaja partiitöötlusega (~25-40 tok/s ühevoog 8x RTX 5090-l, avaldatud viide)
- GLM-4.5 / 4.6 / 4.7 4. kvartal (~177 GB) — lipulaevaks olev arutluskäik/kodeerimine, 200 000 CTX versioonil 4.6+
- GLM-5 / GLM-5.1 Q2 (~260 GB) väikese RAM-i hajumisega — piirialade kodeering, mis on Claude Opus 4.6 tasemel.
- DeepSeek V3 / R1 / V3.1 / V3.2 / V3.2-Special Q2 (~215 GB) kasuliku järelduskiirusega (~28 tok/s ühe voo puhul 8x Blackwelli edastusvõrgus, avaldatud viide)
- Kimi-K2 1.58-bitine UD-TQ1_0 (~240 GB) — triljoni parameetriga agent reaalse tokeni läbilaskevõimega (~7–10 tok/s ühevoog, avaldatud viide)
- Hunyuan-Large 389B/52B MoE Q4 (~220 GB); ERNIE-4.5-424B-A47B 4. kvartal (~240 GB)
- Qwen3-Coder-480B-A35B 4. kvartal (~270 GB RAM-i hajumisega) – SOTA avatud kodeerimise lipulaev
- MiniMax-M1 / Tekst-01 4. kvartal (~260 GB) 1 miljoni kontekst; Qwen3.5-397B-A17B 4. kvartal (~214 GB)
Läänepiir
- Mistral Suur 3 (675B/41B MoE, Apache 2.0) Q3 (~317 GB koos lekkega) — Western Frontieri avatud kaalud
- Leek 4 Maverick (400B/17B, 128 eksperti) 4. kvartal (~232 GB) multimodaalne
- Llama-3.1-Nemotron Ultra 253B Q4 (~119 GB) – võrdub DeepSeek-R1-ga poole väiksemalt
- gpt-oss-120b MXFP4 natiivne (80 GB) mugavalt ruumiga mitmele mudelile
- Devstral 2 123B (muudetud MIT) Q6 — ülemine avatud kodeering, 256k ctx
- Laama 3.3 70B bf16 (~142 GB) mitme üürnikuga teenindus (~30–40 tok/s ühe voo kohta RTX 5090 paari kohta TP2, avaldatud viide)
Nägemis-keele mudelid
Qwen3-VL-235B-A22B täis bf16 (~240 GB kaardil); InternVL3.5-241B-A28B (~135 GB Q4); Llama 3.2 90B Vision bf16; Pixtral Large 124B bf16 (~248 GB mahutavusega); Qwen3-Omni-30B-A3B; Molmo 72B; ERNIE-4.5-VL; GLM-4.6V täis. Blackwelli fp8 rada annab visiooni-torni järeldusel ~2x läbilaskevõimet võrreldes Adaga.
Pildi genereerimine
FLUX.1 [dev] / Kontext / Tööriistad täisversioon bf16 (~10-18 s/pilt kaadrisagedusega 8 kaardi kohta, avaldatud viide); SD 3.5 Large; HunyuanImage-2.1 (17B, natiivne 2K); HunyuanImage-3.0 80B/13B MoE; AuraFlow; OmniGen; mitme töötajaga ComfyUI farmid.
Video genereerimine
Wan 2.2 T2V-A14B / I2V-A14B kahekordne ekspertkaart bf16 (mõlemad samaaegselt nii kõrge müratasemega kui ka madala müratasemega residentkaardid); HunyuanVideo 13B bf16, mõlemad eksperdid; Open-Sora 2.0 (11B) bf16; CogVideoX-5B; Mochi-1; LTX-Video; Pyramid Flow; SVD / SV3D / SV4D; NVIDIA Cosmos Predict 2.
Heli / kõne / TTS
- ASR: Whisper v3 suur / turbo (~50x reaalajas); Parakeet-TDT 1.1B; Canary 1B; Qwen3-ASR; SenseVoice
- TTS: CosyVoice 2/3; Kokoro; Stabiilne heli avatud; XTTS v2; Step-Audio-EditX
- Reaalajas / S2S: Kyutai Moshi; Step-Audio 2 mini / R1; Qwen2.5-Omni-7B
- Muusika / heliefektid: MusicGen; AudioGen; Bark; SeamlessM4T v2
Mitme mudeli / mitme üürniku teenindus
- Piiripõhine järeldusvärav – 200B+ moodul + samaaegne 70B + pilt + video, kõik residentid
- 8-suunaline tensorparalleel Kimi-K2 / DeepSeek V3 jaoks reaalses kontekstis
- Mitmekasutajaline LLM API — 50–100 samaaegset kasutajat 235B Q4-l vLLM/SGLangi kaudu
- Täielik Hiina ja läänepiiriala residentsus samaaegselt hindamiseks/võrdlusuuringuteks
Sihtkoormused
- Frontieri avatud kaaluga järelduste taustsüsteem 100–500-kohalisele organisatsioonile, mis ühendab Qwen3-235B, GLM-4.5+ ja DeepSeek V3 Q2.
- Kimi-K2 1.58-bitine agendiplatvorm tootmisläbilaskevõime juures (tööriistakasutus, üle 200 järjestikuse kõne)
- Täis-fp8 DeepSeek V3 / R1, mis teenindab Blackwelli silikooni
- Mitmesõlmeline treeningpea Gen5 100 GbE / InfiniBand kangaga
- Kahe rolliga järeldus- ja difusioonitalumaja (Qwen3-235B + FLUX.1 + HunyuanVideo 13B samaaegselt)
Avaldatud toimivuse viited
Välised viited | Kentino riistvaral ei ole mõõdetud
| võrrelda | Tulemus |
|---|---|
| RTX 5090 kaardi kohta INT8 TOPS | 1 676 TOPSi |
| RTX 5090 mälu ribalaius | ~1 800 GB/s kaardi kohta |
| vLLM — Qwen3-235B Q4_K_M 4x RTX 5090-l (üksik) | ~90 tokki/s |
| vLLM — Qwen3-235B Q4_K_M 4x RTX 5090 peal (partii-32) | ~450 tok/s agregaat |
| SGLang — DeepSeek V3 Q2 8x Blackwelli peal (üksik) | ~28 tokki/s |
| llama.cpp – Kimi-K2 UD-TQ1_0 8x Blackwelli 256 GB-l | ~7–10 tokki/s |
Kentino avaldab esimese osapoole tokid pärast esimese kliendi loodud lõpliku Torino SKU-ga versiooni.
Pole ideaalne
- Eelarveteadlikud juurutused (Torino premium vs Genova või Rooma alternatiivid)
- Ühe üürnikuga 70B tihedad töökoormused (liiga suur koormus – õige aste on 4x RTX 5090 või 4x RTX Pro 6000)
- Frontier 600B+ Q4+ täiskontekstis (nõuab vähemalt 576 GB salvestusruumi – vt 6x RTX Pro 6000)
- Jätkuv treenimine nullist (tarbijale mõeldud RTX 5090 puhul NVLinki pole)
Garantii ja tarneaeg
Komplekteerimine hõlmab kokkupanekut, BIOS-i seadistamist, draiveri installimist, sissepõlemistesti ja funktsionaalsuse kontrolli. Tarneaeg sõltub komponentide saadavusest, mis kinnitatakse tellimuse esitamisel.
Soovitatavad lisandmoodulid
- Skaleeri RAM-i 1.5 TB DDR5-ni (24x 64 GB täisarvuga) – vajalik Kimi-K2 Q4 või DeepSeek V3 Q3 jaoks ilma RAM-i lekketa
- NVIDIA ConnectX-5 100 GbE MCX555A-ECAT — 5. põlvkonna võrk klastrisõlmedele
- Mellanox ConnectX-6 25 GbE SFP28 andmekeskuse võrgu jaoks
- 4 TB NVMe Gen4 x4 käivitamiseks + mudeliteek
- Täielik 24U rack-kapp hallatava PDU-ga
- Online-UPS 8–10 kVA (kriitiline – tipptarve 5.5 kW)
Jaga
