跳至产品信息
1 / 7

Kentino sro

K-AI 256 TurinDual 5090 — 8× RTX 5090 kahe pesaga Zen5c lipulaev (küsi protsessori hinnapakkumist)

K-AI 256 TurinDual 5090 — 8× RTX 5090 kahe pesaga Zen5c lipulaev (küsi protsessori hinnapakkumist)

常规价格 EUR € 0,00
常规价格 促销价 EUR € 0,00
Edutamine välja müüdud
已含税费. 结账时计算的运费.

K-AI 256 TurinDual 5090 13408TOPS

256 GB videomäluga lipulaevjäreldusserver
8x RTX 5090 | Kahekordne EPYC Torino | 13 408 TOPS INT8

13 408
TOPS INT8
256 GB
VRAM-i bassein
fp8
Blackwelli põliselanik
Gen5
PCIe otsast lõpuni

Protsessori hinnakujundus vormistati tellimuse esitamisel – Torino 9005-seeria turg liigub 2026. aasta teises kvartalis igal nädalal.

Avaldatud välised viited. Kentino riistvaral ei ole mõõdetud.

7U riiulile paigaldatav lipulaev-inferentsiaalserver kaheksa GeForce RTX 5090 graafikakaardiga (32 GB GDDR7, Blackwell, natiivne fp8) kahe pesaga EPYC Turin (Zen5c, SP5) platvormil, 768 GB DDR5-4800 ECC-ga kõigil 12 kanalil, 2 TB NVMe alglaadimismälu ja 5 × 1200 W serveri toiteplokiga. Ots-otsa PCIe Gen5 ühendus graafikakaardil aktiivsete retimer/rediiver riserite kaudu. Käitab vLLM-i, SGLangi, llama.cpp-i, ComfyUI-d ja kõiki peamisi avatud kaaluga inferentsiaalpinu koheselt.

riistvara

Komponent detail
GPU 8x NVIDIA GeForce RTX 5090 32 GB GDDR7 (Blackwell, 575 W TGP, PCIe 5.0 x16, natiivne fp8, 1676 INT8 TOPS/kaart)
VRAM-i bassein 256 GB kokku 8 kaardil (tarbijale mõeldud RTX 5090 puhul NVLinki pole)
Protsessor 2x AMD EPYC Turin 9005-seeria (Zen5c, SP5, PCIe 5.0) — tellimuse esitamisel hinnapakkumine ootel
Emaplaat ASRock Rack TURIN2D24XGM/500W (kahekordne SP5, PCIe 5.0, 24x DDR5 DIMM)
Süsteemi RAM 768 GB DDR5-4800 ECC RDIMM (12x 64 GB — kõik 12 kanalit täidetud; 12 pesa on alles skaleerimiseks 1.5 TB-ni)
Saapa/panipaik 2 TB NVMe M.2 (PCIe 4.0 x4)
Toiteallikas 5x 1200 W serveri toiteploki komplekt (HP-ühilduv, 6 kW agregaat)
Šassii 7U 8-GPU (kuni 10 PCIe pesa, eraldi toiteploki pesad)
Jahutus 2x SP5 tornjahutit + riiulile paigaldatav eest taha suunatud õhuvool (tööstuslikud ventilaatorid)
JUHTRAUA KÕRGENDUSED 8x aktiivset PCIe Gen5 x16 (retimer/redriver) – otsast lõpuni Gen5
võrk Emaplaadil olev 10 GbE (sõltub emaplaadist)

Võimsusümbris

  • Graafikaprotsessori energiatarve: 8 x 575 W = 2400 W
  • Süsteemi koguvõimsus täiskoormusel: ~1825 W
  • Toiteploki koguvõimsus: 6000 W (5x 1200 W) — 8% varu spetsifikatsiooni järgi
  • Kentino graafikakaardi võimsuspiirang on 500 W – koguvõimsus langeb ~4920 W-ni (~15% võimsusvaru).

Raja topoloogia

Dual Turin pakub hosti poolel 2x 128 = 256 PCIe Gen5 rada. Aktiivsed Gen5 riserid kannavad iga graafikakaardi puhul ots-otsa Gen5 x16 rada – PCIe lülitit pole vaja (üks protsessor 4-kaardilise panga kohta). NVLink puudub; graafikakaartidevaheline P2P Gen5 x16 radadel (~60 GB/s nominaalne lingi kohta).

Mida sa joosta saad

256 GB koondatud videomäluga kaheksal Blackwelli kaardil, millel on natiivne fp8, on see server suunatud neljandas kvartalis reaalse konteksti korral piiripealse 235-480B MoE-le, teises kvartalis DeepSeek V3 perekonnale ja reaalse läbilaskevõimega Kimi-K2 1.58-bitisele dünaamilisele kvantmälule.

LLM-id — tekst / arutluskäik / kodeerimine

Hiina piir

  • Qwen3-235B-A22B (Instruct / Thinking / "2507") Q4 (~132 GB) pika konteksti ja mitme kasutaja partiitöötlusega (~25-40 tok/s ühevoog 8x RTX 5090-l, avaldatud viide)
  • GLM-4.5 / 4.6 / 4.7 4. kvartal (~177 GB) — lipulaevaks olev arutluskäik/kodeerimine, 200 000 CTX versioonil 4.6+
  • GLM-5 / GLM-5.1 Q2 (~260 GB) väikese RAM-i hajumisega — piirialade kodeering, mis on Claude Opus 4.6 tasemel.
  • DeepSeek V3 / R1 / V3.1 / V3.2 / V3.2-Special Q2 (~215 GB) kasuliku järelduskiirusega (~28 tok/s ühe voo puhul 8x Blackwelli edastusvõrgus, avaldatud viide)
  • Kimi-K2 1.58-bitine UD-TQ1_0 (~240 GB) — triljoni parameetriga agent reaalse tokeni läbilaskevõimega (~7–10 tok/s ühevoog, avaldatud viide)
  • Hunyuan-Large 389B/52B MoE Q4 (~220 GB); ERNIE-4.5-424B-A47B 4. kvartal (~240 GB)
  • Qwen3-Coder-480B-A35B 4. kvartal (~270 GB RAM-i hajumisega) – SOTA avatud kodeerimise lipulaev
  • MiniMax-M1 / Tekst-01 4. kvartal (~260 GB) 1 miljoni kontekst; Qwen3.5-397B-A17B 4. kvartal (~214 GB)

Läänepiir

  • Mistral Suur 3 (675B/41B MoE, Apache 2.0) Q3 (~317 GB koos lekkega) — Western Frontieri avatud kaalud
  • Leek 4 Maverick (400B/17B, 128 eksperti) 4. kvartal (~232 GB) multimodaalne
  • Llama-3.1-Nemotron Ultra 253B Q4 (~119 GB) – võrdub DeepSeek-R1-ga poole väiksemalt
  • gpt-oss-120b MXFP4 natiivne (80 GB) mugavalt ruumiga mitmele mudelile
  • Devstral 2 123B (muudetud MIT) Q6 — ülemine avatud kodeering, 256k ctx
  • Laama 3.3 70B bf16 (~142 GB) mitme üürnikuga teenindus (~30–40 tok/s ühe voo kohta RTX 5090 paari kohta TP2, avaldatud viide)

Nägemis-keele mudelid

Qwen3-VL-235B-A22B täis bf16 (~240 GB kaardil); InternVL3.5-241B-A28B (~135 GB Q4); Llama 3.2 90B Vision bf16; Pixtral Large 124B bf16 (~248 GB mahutavusega); Qwen3-Omni-30B-A3B; Molmo 72B; ERNIE-4.5-VL; GLM-4.6V täis. Blackwelli fp8 rada annab visiooni-torni järeldusel ~2x läbilaskevõimet võrreldes Adaga.

Pildi genereerimine

FLUX.1 [dev] / Kontext / Tööriistad täisversioon bf16 (~10-18 s/pilt kaadrisagedusega 8 kaardi kohta, avaldatud viide); SD 3.5 Large; HunyuanImage-2.1 (17B, natiivne 2K); HunyuanImage-3.0 80B/13B MoE; AuraFlow; OmniGen; mitme töötajaga ComfyUI farmid.

Video genereerimine

Wan 2.2 T2V-A14B / I2V-A14B kahekordne ekspertkaart bf16 (mõlemad samaaegselt nii kõrge müratasemega kui ka madala müratasemega residentkaardid); HunyuanVideo 13B bf16, mõlemad eksperdid; Open-Sora 2.0 (11B) bf16; CogVideoX-5B; Mochi-1; LTX-Video; Pyramid Flow; SVD / SV3D / SV4D; NVIDIA Cosmos Predict 2.

Heli / kõne / TTS

  • ASR: Whisper v3 suur / turbo (~50x reaalajas); Parakeet-TDT 1.1B; Canary 1B; Qwen3-ASR; SenseVoice
  • TTS: CosyVoice 2/3; Kokoro; Stabiilne heli avatud; XTTS v2; Step-Audio-EditX
  • Reaalajas / S2S: Kyutai Moshi; Step-Audio 2 mini / R1; Qwen2.5-Omni-7B
  • Muusika / heliefektid: MusicGen; AudioGen; Bark; SeamlessM4T v2

Mitme mudeli / mitme üürniku teenindus

  • Piiripõhine järeldusvärav – 200B+ moodul + samaaegne 70B + pilt + video, kõik residentid
  • 8-suunaline tensorparalleel Kimi-K2 / DeepSeek V3 jaoks reaalses kontekstis
  • Mitmekasutajaline LLM API — 50–100 samaaegset kasutajat 235B Q4-l vLLM/SGLangi kaudu
  • Täielik Hiina ja läänepiiriala residentsus samaaegselt hindamiseks/võrdlusuuringuteks

Sihtkoormused

  • Frontieri avatud kaaluga järelduste taustsüsteem 100–500-kohalisele organisatsioonile, mis ühendab Qwen3-235B, GLM-4.5+ ja DeepSeek V3 Q2.
  • Kimi-K2 1.58-bitine agendiplatvorm tootmisläbilaskevõime juures (tööriistakasutus, üle 200 järjestikuse kõne)
  • Täis-fp8 DeepSeek V3 / R1, mis teenindab Blackwelli silikooni
  • Mitmesõlmeline treeningpea Gen5 100 GbE / InfiniBand kangaga
  • Kahe rolliga järeldus- ja difusioonitalumaja (Qwen3-235B + FLUX.1 + HunyuanVideo 13B samaaegselt)

Avaldatud toimivuse viited

Välised viited | Kentino riistvaral ei ole mõõdetud

võrrelda Tulemus
RTX 5090 kaardi kohta INT8 TOPS 1 676 TOPSi
RTX 5090 mälu ribalaius ~1 800 GB/s kaardi kohta
vLLM — Qwen3-235B Q4_K_M 4x RTX 5090-l (üksik) ~90 tokki/s
vLLM — Qwen3-235B Q4_K_M 4x RTX 5090 peal (partii-32) ~450 tok/s agregaat
SGLang — DeepSeek V3 Q2 8x Blackwelli peal (üksik) ~28 tokki/s
llama.cpp – Kimi-K2 UD-TQ1_0 8x Blackwelli 256 GB-l ~7–10 tokki/s

Kentino avaldab esimese osapoole tokid pärast esimese kliendi loodud lõpliku Torino SKU-ga versiooni.

Pole ideaalne

  • Eelarveteadlikud juurutused (Torino premium vs Genova või Rooma alternatiivid)
  • Ühe üürnikuga 70B tihedad töökoormused (liiga suur koormus – õige aste on 4x RTX 5090 või 4x RTX Pro 6000)
  • Frontier 600B+ Q4+ täiskontekstis (nõuab vähemalt 576 GB salvestusruumi – vt 6x RTX Pro 6000)
  • Jätkuv treenimine nullist (tarbijale mõeldud RTX 5090 puhul NVLinki pole)

Garantii ja tarneaeg

2 aastat
varuosade garantii
1 aasta
töögarantii
10-28 päeva
ettevalmistusaeg

Komplekteerimine hõlmab kokkupanekut, BIOS-i seadistamist, draiveri installimist, sissepõlemistesti ja funktsionaalsuse kontrolli. Tarneaeg sõltub komponentide saadavusest, mis kinnitatakse tellimuse esitamisel.

Soovitatavad lisandmoodulid

  • Skaleeri RAM-i 1.5 TB DDR5-ni (24x 64 GB täisarvuga) – vajalik Kimi-K2 Q4 või DeepSeek V3 Q3 jaoks ilma RAM-i lekketa
  • NVIDIA ConnectX-5 100 GbE MCX555A-ECAT — 5. põlvkonna võrk klastrisõlmedele
  • Mellanox ConnectX-6 25 GbE SFP28 andmekeskuse võrgu jaoks
  • 4 TB NVMe Gen4 x4 käivitamiseks + mudeliteek
  • Täielik 24U rack-kapp hallatava PDU-ga
  • Online-UPS 8–10 kVA (kriitiline – tipptarve 5.5 kW)
查看完整详细信息