Instans P4d Amazon EC2 bertenaga A100 baru tersedia saat GPU NVIDIA mencapai 10 tahun di AWS.

Instans GPU pertama Amazon Web Services memulai debutnya 10 tahun lalu, dengan NVIDIA M2050. Pada saat itu, aplikasi berbasis CUDA difokuskan terutama pada percepatan simulasi ilmiah, dengan munculnya AI dan pembelajaran mendalam masih jauh.

Sejak itu, AWS telah menambahkan instans GPU cloudnya yang stabil, yang mencakup K80 (p2), K520 (g3), M60 (g4), V100 (p3 / p3dn) dan T4 (g4).

Dengan instans P4d barunya yang umumnya tersedia saat ini , AWS membuka jalan untuk dekade komputasi akselerasi yang berani lainnya yang ditenagai dengan GPU Tensor Core NVIDIA A100 terbaru .

Instans P4d memberikan platform berbasis GPU berkinerja tertinggi dan paling hemat biaya dari AWS untuk pelatihan pembelajaran mesin dan aplikasi komputasi kinerja tinggi. Instans mengurangi waktu untuk melatih model pembelajaran mesin hingga 3x dengan FP16 dan hingga 6x dengan TF32 dibandingkan dengan presisi FP32 default.

Mereka juga memberikan kinerja inferensi yang luar biasa. GPU NVIDIA A100 bulan lalu menyapu tolok ukur Inferensi MLPerf – memberikan kinerja hingga 237x lebih cepat daripada CPU.

Setiap instans P4d memiliki delapan GPU NVIDIA A100 dan, dengan AWS UltraClusters, pelanggan bisa mendapatkan akses sesuai permintaan dan skalabel ke lebih dari 4.000 GPU sekaligus menggunakan Adaptor Fabric Elastis (EFA) AWS dan penyimpanan berkinerja tinggi yang dapat diskalakan dengan Amazon FSx. P4d menawarkan jaringan 400Gbps dan menggunakan teknologi NVIDIA seperti NVLink , NVSwitch , NCCL dan GPUDirect RDMA untuk lebih mempercepat beban kerja pelatihan deep learning. NVIDIA GPUDirect RDMA di EFA memastikan jaringan latensi rendah dengan meneruskan data dari GPU ke GPU antar server tanpa harus melewati CPU dan memori sistem.

Selain itu, instans P4d didukung di banyak layanan AWS, termasuk Amazon Elastic Container Services, Amazon Elastic Kubernetes Service, AWS ParallelCluster, dan Amazon SageMaker. P4d juga dapat memanfaatkan semua perangkat lunak dalam container yang dioptimalkan yang tersedia dari NGC , termasuk aplikasi HPC, kerangka kerja AI, model terlatih, bagan Helm, dan perangkat lunak inferensi seperti TensorRT dan Triton Inference Server .

Instans P4d sekarang tersedia di AS Timur dan Barat, dan segera hadir di wilayah tambahan. Instans dapat dibeli sebagai Sesuai Permintaan, dengan Savings Plans, dengan Instans Cadangan, atau sebagai Instans Spot.

Dekade pertama komputasi awan GPU telah menghadirkan lebih dari 100 exaflops komputasi AI ke pasar. Dengan kedatangan instans Amazon EC2 P4d yang didukung oleh GPU NVIDIA A100, komputasi awan GPU dekade berikutnya dimulai dengan awal yang baik.

NVIDIA dan AWS memungkinkan aplikasi untuk terus mendorong batas AI di beragam aplikasi. Kami tidak sabar untuk melihat apa yang akan dilakukan pelanggan dengan itu.