Kartu Grafik

Nvidia meluncurkan tesla t4, kartu tercepat untuk pusat data

Daftar Isi:

Anonim

Nvidia telah mengumumkan GPU baru untuk pembelajaran mesin dan inferensi di pusat data. Kartu Tesla T4 baru didasarkan pada arsitektur Turing, dan merupakan penerus dari model Tesla P4 saat ini, yang mencakup hampir semua penyedia komputasi awan utama.

Nvidia Tesla T4 ingin merevolusi pusat data

Nvidia berpendapat bahwa Tesla T4s secara signifikan lebih cepat daripada P4s. Untuk inferensi bahasa, misalnya, T4 adalah 34 kali lebih cepat daripada menggunakan CPU dan lebih dari 3, 5 kali lebih cepat dari P4. Throughput maksimum untuk Tesla P4 adalah 260 TOPS untuk operasi integer 4-bit dan 65 TOPS untuk operasi floating point. T4 menggunakan kartu PCI-e 75-watt profil standar.

Kami merekomendasikan membaca posting kami pada Detail arsitektur Turing Nvidia muncul

Yang paling penting, Nvidia merancang chip ini khusus untuk inferensi AI, yang menjadikan Tesla T4 GPU yang sangat efisien untuk membuat inferensi adalah Tensor Core baru Turing. Jensen Huang telah berbicara tentang Tensor Core baru, dan apa yang dapat dilakukannya untuk gaming, rendering, dan operasi AI. Secara total, chip ini memiliki 320 Tensor Core Turing dan 2.560 core CUDA.

Selain chip baru, Nvidia juga meluncurkan pembaruan untuk perangkat lunak TensorRT untuk mengoptimalkan model pembelajaran yang mendalam. Versi baru ini juga mencakup TensorRT Inference Server, sebuah layanan microser yang sepenuhnya dipaketkan untuk inferensi pusat data yang secara mulus terhubung ke infrastruktur Kubernet yang ada.

Turing adalah salah satu arsitektur Nvidia paling inovatif, bahkan di pasar game, di mana ia akan memungkinkan untuk pertama kalinya memanfaatkan ray tracing secara real time untuk meningkatkan hasil grafis dari game-game paling mutakhir.

Fon Techpowerup

Kartu Grafik

Pilihan Editor

Back to top button