Graphic Card : AMD

ปฎิวัตการประมวลผลประสิทธิภาพสูง (HPC)

AMD Instinct™ MI100 ที่มีประสิทธิภาพการประมวลผลเร็วที่สุดในโลก สำหรับงานด้านการประมวลผลประสิทธิภาพสูง และเป็นกราฟิกการ์ด x86 ตัวแรกของโลกสำหรับเซิร์ฟเวอร์ ที่ก้าวข้ามขีดจำกัดประสิทธิภาพการประมวลผล 10 teraflops (FP64) พร้อมการสนับสนุนจาก Dell, Gigabyte, HPE และ Supermicro  ผลิตภัณฑ์กราฟิกการ์ด AMD Instinct™ MI100 ได้ผสมผสานเข้ากับผลิตภัณฑ์โปรเซสเซอร์ AMD EPYCTM และแพลตฟอร์มซอฟต์แวร์ระบบเปิด ROCm™ 4.0 ที่ออกแบบมาเพื่อส่งเสริมประสิทธิภาพด้านการค้นคว้าสิ่งใหม่ ๆ ในยุคการประมวลผลระดับ Exascale

สถาปัตยกรรมใหม่ AMD CDNA

กราฟิกการ์ด AMD Instinct™ MI100 สร้างขึ้นบนสถาปัตยกรรมใหม่ AMD CDNA ช่วยยกระดับระบบการประมวลผลของงานด้าน HPC และ AI ผลิตภัณฑ์กราฟิกการ์ด AMD Instinct™ MI100 นำเสนอประสิทธิภาพการประมวลผลแบบ FP64 สำหรับงานด้าน HPC ได้สูงสุดถึง 11.5 TFLOPS และประสิทธิภาพการประมวลผลแบบ FP32 Matrix สำหรับเวิร์คโหลดด้าน AI และแมชชีนเลิร์นนิ่ง2 ได้สูงสุดถึง 46.1 TFLOPS  เทคโนโลยีใหม่ AMD Matrix Core ทำให้กราฟิกการ์ด AMD Instinct™ MI100 สามารถส่งมอบประสิทธิภาพการประมวลผลสูงสุดแบบ FP16 ในระบบแทนจำนวนแบบ Floating-point เพิ่มขึ้นเกือบ 7 เท่า ในเวิร์คโหลดงานด้านการฝึกอบรม AI เมื่อนำไปเปรียบเทียบกับกราฟิกการ์ดรุ่นก่อนหน้าของ AMD

แพลตฟอร์มซอฟต์แวร์ระบบเปิด สำหรับยุคการประมวลผลระดับ Exascale

ซอฟต์แวร์ AMD ROCm สำหรับนักพัฒนานำเสนอรากฐานในการประมวลผลระดับ Exascales เป็นเครื่องมือสำหรับงานด้านโอเพ่นซอร์สที่ประกอบด้วย คอมไพเลอร์ (compilers), การเขียนโปรแกรมแบบ APIs (programming APIs) และไลบรารี (libraries)  โดยนักพัฒนาซอฟต์แวร์ที่ต้องการการประมวลผลระดับ Exascale จะนำ AMD ROCm มาสร้างสรรค์แอปพลิเคชั่นประสิทธิภาพสูง  ทั้งนี้ ROCm 4.0 ได้รับการปรับให้เหมาะสมกับการใช้งาน เพื่อส่งมอบประสิทธิภาพที่เหมาะสมสำหรับผู้ใช้กราฟิกการ์ด MI100 โดยซอฟต์แวร์ AMD ROCm 4.0 จะทำการอัพเกรดคอมไพเลอร์เป็นโอเพ่นซอร์สและผนวกเข้าไว้ด้วยกันเพื่อรองรับงานรูปแบบ OpenMP® 5.0 และ HIP  อีกทั้งเฟรมเวิร์ค PyTorch และ Tensorflow ที่มีการปรับให้เหมาะสมกับซอฟต์แวร์ AMD ROCm 4.0 ทำให้สามารถบรรลุประสิทธิภาพการประมวลผลที่สูงขึ้นด้วยกราฟิกการ์ด AMD Instinct MI1007,8 โดย AMD ROCm 4.0 จะเป็นซอฟต์แวร์รุ่นล่าสุดสำหรับนักพัฒนาแอปพลิเคชั่นงานกลุ่ม HPC, ML และ AI ช่วยให้สามารถสร้างซอฟต์แวร์ประเภท Portable software ได้อย่างมีประสิทธิภาพ

AMD Instinct™ MI100

GPU Specifications

GPU Architecture : CDNA
Lithography : TSMC 7nm FinFET
Stream Processors : 7,680
Compute Units : 120
Peak Engine Clock : 1502 MHz
Peak Half Precision (FP16) Performance : 184.6 TFLOPs

Peak Single Precision Matrix (FP32) Performance : 46.1 TFLOPs
Peak Single Precision (FP32) Performance : 23.1 TFLOPs
Peak Double Precision (FP64) Performance : 11.5 TFLOPs

Peak INT4 Performance : 184.6 TOPs
Peak INT8 Performance : 184.6 TOPs
Peak bfloat16 : 92.3 TFLOPs
OS Support : Linux x86_64

GPU Memory

Memory Size : 32 GB
Memory Clock : 1.2 GHz

Memory Type (GPU) : HBM2
Memory Bandwidth : Up to 1228.8 GB/s

Memory Interface : 4096-bit
Memory ECC Support : Yes (Full-Chip)

Board Specifications

Form Factor : PCIe® Add-in Card
Peak Infinity Fabric™ Link Bandwidth : 92 GB/s
Board Width : Double Slot
External Power Connectors : 2x PCIe® 8-pin

Bus Type : PCIe® 4.0 x16 / PCIe® 3.0 x16
TBP : 300W
Board Length : 10.5″ (267 mm)

Infinity Fabric™ Links : 3
Board Height : Full Height

Additional Features

Supported Technologies :
AMD CDNA Architecture
AMD Infinity Architecture
AMD ROCm™ – Open, Flexible and Portable

RAS Support : Yes

Page Retirement : Yes

Software API Support

OpenMP® : Yes
OpenCL™ : Yes

HIP : Yes

ROCm™ Open Ecosystem : Yes

Frameworks

TensorFlow : Yes
PyTorch : Yes

Kokkos : Yes

RAJA : Yes

Product Basics

Product Family : AMD Instinct™
Product Line : AMD Instinct™ MI Series

Platform : Server

Launch Date : 11/16/2020

ผลิตภัณฑ์ Graphic Card