- Tại sự kiện thường niên AWS re:Invent, Amazon Web Services, Inc. (AWS), một công ty của Amazon.com đã giới thiệu ba máy chủ ảo mới Amazon Elastic Compute Cloud (Amazon EC2) instance, sử dụng ba loại chip mới do Amazon thiết kế, có khả năng cung cấp cho khách hàng hiệu năng tính toán cao (HPC) cùng chi phí thấp hơn và phù hợp với nhiều loại ứng dụng khác nhau.
David Brown, Phó Chủ tịch bộ phận Amazon EC2 của AWS cho biết: "Mỗi thế hệ chip do AWS thiết kế - từ Graviton tới Trainium và Inferentia và Nitro Cards - đều có hiệu năng cao hơn, chi phí thấp hơn và tiết kiệm năng lượng hơn, đáp ứng nhu cầu của nhiều loại hình tải công việc của khách hàng. Khả năng phát triển chip toàn diện của chúng tôi và năng lực đem lại hiệu quả cao hơn về giá thành cho khách hàng chính là động lực thường xuyên thúc đẩy chúng tôi đổi mới sáng tạo. Các máy chủ ảo Amazon EC2 được chúng tôi giới thiệu ngày hôm nay giúp cải thiện đáng kể các loại ứng dụng tính toán hiệu năng cao, các ứng dụng tiêu thụ nhiều tài nguyên mạng và ứng dụng suy luận học máy, mang lại cho khách hàng nhiều lựa chọn máy chủ ảo hơn để đáp ứng nhu cầu cụ thể của mình."
Máy chủ ảo Hpc7g là máy chủ ảo chuyên biệt có hiệu quả giá thành tốt nhất để chạy các ứng dụng HPC quy mô lớn trên Amazon EC2.
Máy chủ ảo Hpc7g |
Sử dụng các bộ xử lý AWS Graviton3E mới, máy chủ ảo Hpc7g mang lại hiệu quả giá thành cao nhất cho các ứng dụng HPC của khách hàng (chẳng hạn CFD, mô phỏng thời tiết, giải mã gien và động lực học phân tử) trên Amazon EC2.
Các máy chủ ảo Hpc7g cung cấp hiệu năng FLOPS cao gấp đôi máy chủ ảo C6gn thế hệ hiện tại sử dụng các bộ xử lý Graviton2 và hiệu năng cao hơn tới 20% so với máy chủ Hpc6a thế hệ hiện tại, tạo điều kiện cho khách hàng thực hiện các phép tính toán phức tạp xuyên suốt các cụm HPC với hàng chục ngàn lõi xử lý.
Máy chủ ảo Hpc7g còn cung cấp băng thông bộ nhớ cao và băng thông mạng cao nhất trên một CPU so với tất cả các loại máy chủ ảo khác của AWS để giúp rút ngắn thời gian tính toán của các ứng dụng HPC. Khách hàng có thể sử dụng máy chủ ảo Hpc7g cùng với ParallelCluster, một công cụ quản lý cụm máy chủ mã nguồn mở, để cấp phát các máy chủ ảo Hpc7g cùng với các loại máy chủ ảo khác, giúp khách hàng có thể linh hoạt chạy các loại ứng dụng khác nhau trong cùng một cụm HPC.
Trong khi đó, máy chủ ảo C7gn có hiệu năng tốt nhất cho các ứng dụng tiêu thụ nhiều tài nguyên mạng, với băng thông kết nối mạng cao hơn, tốc độ truyền gói tin cao hơn và độ trễ thấp hơn.
máy chủ ảo C7gn |
Khách hàng có thể sử dụng các máy chủ ảo được tối ưu hoá cho kết nối mạng của Amazon EC2 để chạy những ứng dụng yêu cầu nhiều tài nguyên mạng nhất, chẳng hạn như các thiết bị chuyên dụng mạng ảo (tường lửa, bộ định tuyến ảo và các bộ cân bằng tải) và mã hoá dữ liệu. Khách hàng cần nâng cao hiệu năng của những ứng dụng này để xử lý lưu lượng mạng tăng cao vào những giờ cao điểm hoặc giảm thời gian xử lý để cung cấp trải nghiệm tốt hơn cho người dùng cuối. Ngày nay, khách hàng sử dụng các loại máy chủ ảo kích thước lớn hơn để có băng thông cao hơn, triển khai tài nguyên tính toán nhiều hơn cần thiết, dẫn tới tăng chi phí. Những khách hàng này cần tăng hiệu năng xử lý gói tin trên một giây, băng thông mạng cao hơn và hiệu năng mã hoá cao hơn để giảm thời gian xử lý dữ liệu.
Máy chủ ảo C7gn, được trang bị card mạng AWS Nitro Cards mới sử dụng chip Nitro thế hệ thứ năm với tính năng tăng tốc mạng, cung cấp băng thông mạng và hiệu năng xử lý gói tin cao nhất trong tất cả các loại máy chủ ảo được tối ưu hóa cho mạng của Amazon EC2. Card mạng Nitro Cards giảm tải và tăng tốc xử lý Input/Output cho các chức năng, từ CPU chủ cho tới phần cứng chuyên biệt để cung cấp gần như toàn bộ tài nguyên của một máy chủ ảo Amazon EC2 cho ứng dụng của khách hàng để có hiệu năng nhất quán hơn với mức độ sử dụng CPU thấp hơn.
Inf2 là máy chủ ảo chuyên dụng cho các dự án triển khai mô hình học sâu cần nhiều tài nguyên nhất hiện nay, với khả năng hỗ trợ tính năng suy luận phân tán và làm tròn ngẫu nhiên.
Máy chủ ảo Inf2 sử dụng bộ xử lý Inferentia2 mới, hỗ trợ các mô hình học sâu lớn (chẳng hạn LLM, tạo hình ảnh và tự động phát hiện giọng nói) với số lượng tham số lên tới 175 tỷ , đồng thời cho chi phí suy luận thấp nhất trong Amazon EC2. Inf2 là máy chủ ảo đầu tiên được tối ưu hóa cho suy luận có thể hỗ trợ suy luận phân tán, là kỹ thuật phân tán các mô hình lớn lên nhiều bộ xử lý để mang lại hiệu năng tốt nhất cho các mô hình học sâu với hơn 100 tỷ tham số.
Máy chủ ảo Inf2 cũng là loại máy chủ ảo đầu tiên trên đám mây hỗ trợ làm tròn ngẫu nhiên, một phương pháp làm tròn thống kê có hiệu năng và độ chính xác cao hơn so với các phương pháp làm tròn trước đây. Máy chủ ảo Inf2 hỗ trợ nhiều loại hình dữ liệu, bao gồm CFP8, có khả năng cải thiện băng thông và giảm mức độ tiêu thụ năng lượng trên một đơn vị suy luận, và FP32, nhằm nâng cao hiệu năng của các mô-đun chưa có khả năng khai thác các loại dữ liệu có độ chính xác thấp.
Phạm Lê