Ehitusviki

Ehitusviki

Teaberaamatute sari tehisintellekti arvutussüsteemide loomise, võrgustamise, toite ja käitamise kohta – ostjatele ja integraatoritele, kes planeerivad oma järgmist 4-GPU-ga boksi, 8-GPU-ga serverit või robootikalaborit.

Iga artikkel on kirjutatud päris Kentino versioonide põhjal. Ei mingeid lisatähendusi. Arvamuslik seal, kus inseneritöö seda nõuab. Aus piiride osas.

20artiklid otseülekandes 9teemalood 2uus nädalas · T + N

Tehisintellekti alusserver W-seeria

Kui spetsifikatsioonid on mitme GPU-ga arvutile, lugege kõigepealt neid. Mälu, PCIe, toide ja GPU lühinimekiri.

W01RAM ja VRAM: kuidas need on tehisintellekti serveris omavahel seotud4-GPU-ga graafikakaart 192 GB videomälu ja 32 GB muutmäluga on katki. Õige suhe sõltub sellest, mida sa tegelikult kasutad.
W02PCIe rajad ja topoloogia mitme GPU-ga tehisintellekti serveris"PCIe x8 vs x16 ei oma järelduste tegemisel tähtsust" on enamasti õige – ja inimesed, kes seda kordavad, tavaliselt ei tea, miks.
W03GPU tõstjad: millal neid vaja läheb ja mis purunebSeal, kus signaali terviklikkus vaikselt sureb, õpivad lingid vaikselt ümber 3. põlvkonnale ja testid, mis testi edukalt läbivad, hakkavad iga päev ühe graafikakaardi maha võtma.
W04Toiteploki suuruse ja kahe toiteploki konfiguratsioonidMatemaatika, vormiteguri reaalsus ja aus raamistik 4-GPU ja 8-GPU toiteallika jaoks.
W07Graafikakaardi valik: 5090, 4090, RTX Pro 6000, L40, L4Aus otsekontakt tegelike tulemusnäitajate, kompromisside ja otsustusprotsessiga, mida me kliendikõnede puhul tegelikult kasutame.

Networking N seeria

NVLinki reaalsus, klastri topoloogiad (leht-selgroog, paksupuu, dragonfly, kommutaatorita), latentsuse analüüs, marsruutimine ja RDMA seadistamine praktikas.

N03NVLink ja NVSwitch: kui see on olulineDGX-i turundus kiitleb terabaitidega sekundis NVLinki ribalaiusega. Enamiku Kentino töökoormuste jaoks pole seda üldse vaja.
N04Lülitatud topoloogiad: pakspuu, leht-selgroog, kiil, tesseraktIga klastri diagramm algab ühtemoodi. Tegelik valik seisneb selles, milline topoloogia on, kui palju on ületellimust ja milline on pordipõhine kiirus.
N05Lülitivabad topoloogiad: võrk-, rõngas- ja otseühendustopoloogiad32-pordilise 400 GbE kommutaatori hind langeb 2026. aasta keskpaigaks 40 000–80 000 euro piiridesse. 2–4 sõlme jaoks pole seda vaja.
N06Latentsuse lahkamine: kuhu iga mikrosekund lähebInimesed mõõdavad võrkude suurust ribalaiuse graafikute abil. Seejärel prindib nende allreduce'i võrdlustest numbri, mis pole kaugeltki liinikiiruse lähedal.
N07Marsruutimine: ECMP, adaptiivne marsruutimine, DCQCNMis juhtub kaablite, võrgukaartide ja lülitite kohal: kuidas paketid tee leiavad ja mis takistab võrgu kokkuvarisemist all-reduce'i režiimis?
N08RDMA seadistamine praktikas + klastri üleslingi disainPraktiline tegevus: installi draiverid, tõesta tee toimimist, lülita sisse GPUDirect, valideeri NCCL ja seejärel astu samm edasi ning kujunda kogu klastri üleslink.

Clustering K seeria

Kui ühest sõlmest ei piisa. Ühe- vs. mitmesõlmeline otsustusprotsess, hajutatud treenimine, järeldusklastrid ja jagatud salvestusruum.

K01Ühesõlmeline mitme GPU vs mitmesõlmeline: millal skaleeridaKõige kallim viga on GPU eelarve jagamine kahe sõlme vahel, kui üks suurem sõlm oleks töö ära teinud.
K02Hajutatud koolitus 2026. aastal: DDP, FSDP2, DeepSpeed, MegatronNeli avatud lähtekoodiga tarkvara, viis paralleelsuse telge ja millist neist millise töö jaoks valida.
K03Järeldusklastrid: vLLM tensorparalleel, torujuhtme paralleel70B mudel ei mahu ühele graafikaprotsessorile kasuliku KV vahemälu juures. 405B ei mahu ühele sõlmele. See, kuidas mudelit kärpida, määrab selle maksumuse.
K04Klastri salvestusruum: NFS, BeeGFS, Lustre, objektisalvestusruumidJagatud salvestusruum on hajutatud klastri osa, millele keegi ei mõtle enne, kui graafikaprotsessorid on selle 40% kasutusastmel.

Integratsioon I seeria

Kõik kokku võttes – roboti ja serveri arhitektuur, mis seob kogu sarja päris riistvaraga.

I01Edge AI arhitektuur: robot ↔ kohapealne järeldusserverKuldstandard. Ostetud humanoid on ainult pool süsteemist; see on teine ​​pool ja see, kuidas need kaks poolt omavahel ühendatakse.

Robotics R-seeria · blogi

Kaasaegne humanoid on kuus või seitse inseneridistsipliini, mis on omavahel ühendatud. Ostuprotsess, miks robotid vajavad spetsiaalset servasarvutust ja tipptasemel VLM-põhine maailmamudelite pinu.

R07Roboti ostmine: tarneajad, tollimaks, tugiRobootika riistvara ostmine EL-is ei ole nagu tööjaama ostmine. Kuidas tegelikult välja näevad tarneajad, tollivormistus ja müügijärgne tugi.
R08Miks robotid vajavad spetsiaalset servaarvutust?Latentsusaja argument. Miks oma mudeli paigutamine pilve API taha rikub kasutusjuhtumi, mida klient tegelikult soovib.
R09Automaatne märgistamine VLM-põhiste maailmamudelitegaTipptasemel tajumisplatvorm – Qwen2.5-VL, Grounded-SAM 2, Florence-2, NVIDIA Cosmos – rakendati robootika maapealse uurimise valdkonnas.

Case Studies C-seeria · blogi

Tõeline Kentino ehitab päris mõõdetud numbrite abil. Fotod, materjaliloendid, võrdlusnäitajad ja ausad järelanalüüsid.

C01Juhtumiuuring: 4× RTX 4090 tehisintellektiga tööjaamEPYC 7542, 512 GB DDR4 ECC, 4× RTX 4090. Mõõdetud 651.6 TFLOPS-i. 179.3 tok/s püsiv vLLM-il. Tipptemperatuur 73 °C. Reaalarvud tarnitud versioonilt.

Uued artiklid igal teisipäeval ja neljapäeval

See wiki on pidevalt kasvav teek – kuni 2026. aastani avaldatakse uusi artikleid ehituse, võrgustamise, klastrite loomise, energia ja robootika kohta, millest igaüks on võetud päris Kentino ehituse põhjal. Kui soovite, et mõni konkreetne teema oleks prioriteetne, kirjutage aadressile info@kentino.com.