Kentino sro
K-AI 192 Rooma ArcProB70 TBD — 6× Intel Arc Pro B70 — EPYC Milano (eeltellimisel)
K-AI 192 Rooma ArcProB70 TBD — 6× Intel Arc Pro B70 — EPYC Milano (eeltellimisel)
Vastuvõtmise saadavust ei õnnestunud laadida
ETTEVALMISTUSES
Eeltellimine — Intel Arc Pro B70 tarne eeldatav 2026. aasta 3. kvartal
K-AI 192 Rooma ArcProB70 selgub hiljem
192 GB videomälu Intel Xe2 järeldusserver
6x Arc Pro B70 | EPYC Milan | TOPS selgub hiljem
Eelarvekeskne suure videomälumahuga mudel, mis on suunatud Inteli avatud lähtekoodiga tarkvarale. Hind sõltub Inteli saadavusest.
4U riiulile paigaldatav järeldusserver kuue Intel Arc Pro B70 Creator kaardiga (32 GB Xe2-HPG "Battlemage" igaüks, kokku 192 GB), ühe AMD EPYC 7643 Milan protsessoriga (48C/96T), 384 GB DDR4 ECC, 2 TB NVMe alglaadimismälu ja 2 kW ATX toiteplokiga (kahe toiteploki uuendamine on tungivalt soovitatav). Loodud Inteli tarkvaraökosüsteemi jaoks: OpenVINO 2025+, IPEX-LLM, llama.cpp SYCL-i taustsüsteem ja vLLM-Inteli harud. Ainult CUDA-põhised töökoormused sellel riistvaral ei tööta.
riistvara
| Komponent | detail |
|---|---|
| GPU | 6x Intel Arc Pro B70 Creator 32 GB (Xe2-HPG "Battlemage", 250 W, PCIe 5.0 x16, kahe pesaga) |
| VRAM-i bassein | 192 GB kokku 6 kaardil (ilma kaartidevahelise võrguta – võrguliiklus PCIe kaudu) |
| Protsessor | AMD EPYC 7643 Milan (48C/96T, 225 W, 128x PCIe 4.0 rajad) |
| Emaplaat | ASRock Rack ROMED8-2T (SP3, 7x PCIe 4.0 x16, 8x DDR4 ECC, 2x 10 GbE, IPMI) |
| Süsteemi RAM | 384 GB DDR4-2666 ECC RDIMM (6x 64 GB) |
| Saapa/panipaik | 2 TB NVMe M.2 (PCIe 4.0 x4) |
| Toiteallikas | 1x 2 kW ATX toiteplokk (kaks 2 kW sünkroniseeritud uuendamist on tungivalt soovitatav) |
| Šassii | 4U riiulile paigaldatav (6 pesaga paigutus) |
| Jahutus | SP3 tornjahuti (Arctic Freezer 4U-M) + eest taha suunatud õhuvool (tööstuslikud ventilaatorid) |
| võrk | Sisseehitatud kahekordne 10 GbE (Intel X550) |
Võimsusümbris
- Graafikaprotsessori energiatarve: 6 x 250 W = 1500 W (Inteli avaldatud TDP)
- Süsteemi koguvõimsus täiskoormusel: ~1825 W
- Toiteploki koguvõimsus: 2000 W (üksik) — ainult 8.75% vaba ruumi
- Soovitatav on tungivalt kasutada kahte 2 kW sünkroniseeritud võimsust — taastab ~45% vaba ruumi
Raja topoloogia
ROMED8-2T pakub 7 PCIe 4.0 x16 rada. Kuus pesa on asustatud; üks vaba võrgukaardi lisamüügiks. Arc Pro B70 on PCIe Gen5 natiivne; ROMED8-2T töötab Gen4-l – ribalaiuse mõju on 32 GB kaardi kohta ebaoluline. PCIe lülitit pole. Xe-Linki ekvivalenti pole.
Mida sa joosta saad
Kõik ühilduvusväited on Inteli tarkvarapaketi teed (OpenVINO, IPEX-LLM, llama.cpp SYCL, vLLM-Intel). Ainult CUDA-põhised töökoormused sellel riistvaral ei tööta. Kõik arvud viitavad avaldatud välistele allikatele ja kuuluvad kaartide tarnimisel sõltumatu kontrolli alla.
LLM-id — tekst / arutluskäik / kodeerimine
Hiina piir
- Qwen3 / Qwen3.5 (Alibaba): Qwen3-235B-A22B Q4 (~132 GB pika kontekstiruumiga); Qwen3-Coder-480B-A35B Q2 (~160 GB); Qwen3.5-397B-A17B Q3 (~170 GB)
- GLM / Z.ai: GLM-4.5 / 4.6 / 4.7 Q4 (~177 GB) — sobib mõõduka KV-ga
- Tencent Hunyuan: Hunyuan-Large Q3 (~160 GB); Hunyuan-A13B fp8 (~80 GB), kui Xe2 fp8 tee on draiveris avatud
- Teised: Baidu ERNIE-4.5-424B Q3 (~180 GB); MiniMax-M1 Q3 (~180 GB); DeepSeek-R2 32B (6x samaaegset voogu)
Läänepiir
- Metalaama: Llama 3.3 70B Q6-Q8 helde KV-ga; mugav Llama 4 Scout 109B/17B Q4 (~63 GB)
- Mistral: Mistral Small 3 / Magistral Small / Devstral Small 2 (24B) bf16-s; Pixtral Large Q4-Q6
- OpenAI (avatud kaalud): gpt-oss-120b MXFP4 natiivne (~80 GB) — kui MXFP4 dequant on Inteli serveris saadaval
- NVIDIA Nemotron: Llama-3.1-Nemotron Ultra 253B Q4 (~120 GB)
- Teised: Gemma 3 27B bf16 multimodaalne; Phi-4 / Phi-4-arutluskäik 14B; Cohere Command R+ 104B Q4
Nägemis-keele mudelid
Qwen3-VL-8B / 32B; Qwen3-VL-30B-A3B MoE; InternVL3 kuni 78B; InternVL3.5-38B; Llama 3.2 90B Vision Q4; Pixtral 12B; Molmo 72B Q4; Gemma 3 12B/27B multimodaalne; MiniCPM-V 2.6 / MiniCPM-o 2.6. Inteli OpenVINO-l on tugev visioonitorni tugi – VLM on usutav esmakordne tugevus.
Pildi genereerimine
FLUX.1 [dev] / [schnell] fp8 või Q4 GGUF llama.cpp SYCL kaudu; SDXL / SD 3.5 Large OpenVINO genAI käitusaja kaudu; HunyuanDiT; HunyuanImage-2.1 bf16 (~34 GB); Värvid 2.0; AuraFlow; OmniGen; PixArt-Sigma.
Video genereerimine
Wan 2.2 T2V-A14B / I2V-A14B MoE (~54 GB bf16); Wan 2.2 TI2V-5B; HunyuanVideo 13B bf16; HunyuanVideo 1.5; CogVideoX-5B; Open-Sora 2.0; LTX-Video; Pyramid Flow; Mochi-1 Q4. Video on Inteli nõrgim rada tänapäeval – eeldatavasti toimib see küll hästi, aga mitte on tarnimise ajal läbilaskevõime poolest optimaalne.
Heli / kõne / TTS
- ASR: Whisper v3 suur / turbo OpenVINO kaudu (esmaklassiline Inteli Whisperi tugi); Parakeet-TDT; Canary; SenseVoice
- TTS: CosyVoice 2/3; Kokoro 82M; Stabiilne heli avatud; XTTS v2; StyleTTS 2; Step-Audio-EditX
- Reaalajas / S2S: Kyutai Moshi; MusicGen / AudioGen / Bark; SeamlessM4T v2
Mitme mudeli / mitme üürniku teenindus
- 6 samaaegset voogu 32 GB Q4 mudelist (üks kaardi kohta) — nt 6 Qwen3-32B Q4 agenti
- Suuremahuline manustamispark — 6 paralleelset BGE-M3 / E5 / Nomic Embed voogu (OpenVINO-optimeeritud)
- Segatud residentuur — 70B Q4 (tensor-paralleel üle 3 kaardi) + FLUX.1 (1 kaart) + Whisper-turbo (1 kaart) + Moshi (1 kaart)
Sihtkoormused
- Inteli tarkvara hindamise pilootprojekt CUDA-alternatiivse LLM-i teenindamiseks
- Manustamise/ümberjärjestamise taustsüsteem, kus VRAM-i maht EUR-i kohta domineerib läbilaskevõime nõuetes
- Väikestele sisemistele arendusmeeskondadele mõeldud eelarve 4. kvartali piiriala-MoE järeldus (Qwen3-235B, GLM-4.5/4.6/4.7)
- OpenVINO-natiivse mudeli juurutamine koos olemasolevate Intel Xeon / Arc Pro torujuhtmetega
- VLM / OCR / dokumenditöötluse taustsüsteem (Inteli OpenVINO tugevus)
Mõõdetud jõudlus
Inteli avaldatud tehnilised andmed | Kaartide tarnimisel toimub sõltumatu kontroll
| Spec | Väärtus |
|---|---|
| VRAM kaardi kohta | 32 GB GDDR6 |
| Mälu ribalaiuse klass | ~450 GB/s kaardi kohta |
| Xe maatriksi laiendused (XMX) | Kiirendatud OpenVINO / IPEX-LLM kaudu |
| fp8 tee | Xe2 räni – juhi kokkupuute kontrollimine saatmise ajal |
Kentino mõõdetud andmed puuduvad. Inteli avaldatud spetsifikatsioonid kuuluvad sõltumatu kontrolli alla. Kentino avaldab esimese osapoole tok/s / QPS / ribalaiuse numbrid, kui esimene seade on läbinud sissepõlemiskatse.
Pole ideaalne
- CUDA-põhised töökoormused – Inteli protsessoritel CUDA-d ei ole, oodata on migratsiooniga seotud probleeme
- Tootmise SLA-kriitilised juurutused kuni Intel Arc Pro tarnete ja tööriistade stabiliseerumiseni
- Frontier 600B+ MoE Q4+ juures (nõuab 6x RTX Pro 6000 / 576 GB salvestusruumi)
- Koolituskoormused – Arc Pro on järelduspõhine, hajutatud koolituse raamistiku küpsus on piiratud
- Kliendid, kes vajavad enne ostmist mõõdetud võrdlusnäitajaid – see SKU on ettetellimisel
Garantii ja tarneaeg
Kentino standardgarantii (2 aastat varuosadele, 1 aasta tööle); Inteli turustustingimused on rangemad, kui need on rangemad. Komplekt sisaldab kokkupanekut, BIOS-i konfigureerimist, draiveri installimist, sissepõlemistesti ja funktsionaalsuse kontrolli. Broneeri oma esimese laine tarneaeg Kentino kontaktvormi kaudu. 30-päevane hinnakinnituse aken tellimuse esitamisel.
Soovitatavad lisandmoodulid
- Kahe 2 kW sünkroniseeritud toiteploki uuendus (ühe toiteploki võimsusvaru on 1825 W juures napp – tungivalt soovitatav)
- Suurenda RAM-i 512 GB DDR4-ni (2x 64 GB — kaks pesa vaba)
- 4 TB NVMe teisene draiv mudeliteegi jaoks
Jaga
