Radeon Open Compute “ROCm” Stack v3.1 Utgitt med RAS for Vega 7nm, SLURM-støtte for bedre ressursadministrasjon, men Navi mangler fortsatt

Radeon Open Compute eller “ROCm” stack ny versjon er nå tilgjengelig for nedlasting. Radeon Open Compute v3.1 bringer med seg ganske mange funksjoner, men merkelig nok mangler fortsatt støtte for AMD Navi og GFX10.

ROCm, den mest aksepterte universelle plattformen for GPU-akselerert databehandling, er nå på versjon 3.1. Den siste oppdateringen av den modulære plattformen som gjør det mulig for maskinvareleverandører å bygge drivere som støtter ROCm-rammeverket, inneholder noen etterlengtede funksjoner som RAS-støtte for 7nm Vega og SLURM-støtte for AMD GPUer. Av grunner som ennå er ukjente, har ROCm fortsatt ikke full støtte for neste generasjons AMD Navi Architecture.

Hva er nytt i Radeon ROCm v3.1:

Den største og mest åpenbare endringen i den nye installasjonen av Radeon ROCm v3.1 er i ROCm Installation Directory Structure. En fersk installasjon av ROCm-verktøysettet installerer pakkene i/ opt / rocm- mappe. Tidligere ble ROCm verktøysettpakker installert i/ opt / rocm mappe.

Den nye versjonen av ROCm har forbedret RAS-støtte (Reliability, Accessibility, and Serviceability) for Vega 7nm GPUer. Dette 7 nm Vega-arbeidet er antagelig under mikroskopet fortsatt for Vegabasert “Arcturus” beregningsakselerator kommer i år. Støtten inkluderer:

  • UMC RAS ​​- HBM ECC (ukorrigerbar feilinjeksjon), tilbaketrekning av side, RAS-gjenoppretting via GPU (BACO) tilbakestilt
  • GFX RAS - GFX, MMHUB ECC (ukorrekt feilinjeksjon), RAS-gjenoppretting via GPU (BACO) tilbakestilt
  • PCIE RAS - PCIE_BIF ECC (ukorrekt feilinjeksjon), RAS-gjenoppretting via GPU (BACO) tilbakestilt

Radeon ROCm v3.1 får også SLURM-støtte for AMD GPUer. SLURM eller Simple Linux Utility for Resource Management er et av de svært foretrukne og brukte klyngestyrings- og jobbplanleggingssystemene for Linux-klynger. SLURM foretrekkes på grunn av at den er åpen kildekode, feiltolerant og svært skalerbar.

Dette systemet kan nå samhandle godt med AMD GPUer. Den siste versjonen 20.02.0 av SLURM inkluderer AMD-plugins som gjør det mulig for SLURM å oppdage og konfigurere AMD GPUer automatisk. Den samler og rapporterer også energiforbruket til grafikkbrikker. SLURM-støtten er et nyttig tillegg gitt det økende antall supercomputer-distribusjoner ved bruk av Radeon GPUer og andre større AMD GPU-klynger.

Til tross for at flere funksjoner er inkludert, er det fortsatt ingen tegn til GFX10 / Navi-støtte i ROCm. GitHub-siden for ROCm er oppdatert for å gjenspeile alle endringer, installasjonsmerknader og kjente problemer.

Facebook Twitter Google Plus Pinterest