AMD Threadripper 3990X: Cách một “dân chơi” thiết lập 10 kỉ lục ép xung

Sau khi ra mắt Ryzen Threadripper 3970X và 3960X được giới công nghệ đánh giá cao vào cuối năm ngoái, AMD đã chọn thời điểm để giới thiệu sản phẩm  flagship HEDT tuyệt đối của mình vào đầu năm 2020. Và không để người dùng phải đợi lâu, AMD đã ra mắt Ryzen Threadripper 3990X cho giới công nghệ trên toàn thế giới, đồng thời đây cũng là bộ vi xử lý x86 đầu tiên trên thị trường tiêu dùng với 64 nhân/128 luồng đầy đủ. Vi xử lý này nhắm đến người dùng chuyên nghiệp với các yêu cầu rất cụ thể về hiệu suất đa luồng, đồng thời với mức xung nhịp lên đến 4.3 GHz của sản phẩm này đem lại mức hiệu năng “khủng khiếp”.

Không như sản phẩm Ryzen Threadripper 3970X trước đây được giới thiệu, vốn dựa trên 4 cụm CCD, mỗi cụm CCD chứa 8 nhân nâng tổng số nhân của sản phẩm lên tới 32 nhân. Ryzen Threadripper 3990X, giống như các model hàng đầu trong dòng máy chủ của AMD EYPC, tổng cộng có tám cụm CCD và do nâng tổng số nhân lên tới 64 nhân, đồng thời hỗ trợ công nghệ SMT nên số luồng là 128.

AMD Ryzen Threadripper 3990X cũng tăng gấp đôi lượng L3 Cache lên tới 256 MB trong khi  L2 Cache là 64 x 512KB. Liên quan đến mức xung nhịp, Ryzen Threadripper 3990X có xung nhịp cơ bản là 2.9 GHz, trong khi đó mức xung Turbo có thể đạt tối đa tới 4.3 GHz – tức thấp hơn 200 MHz so với cả Ryzen Threadripper 3970X và 3960X. Tuy nhiên, có một điểm đáng lưu ý, đó là dù số nhân và luồng tăng lên gấp đôi so với 3970X nhưng giá trị TDP của sản phẩm vẫn ở mức 280W.

Mặt khác, về các phương diện kĩ thuật thì Ryzen Threadripper 3990X cũng tương tự như các dòng vi xử lý thuộc họ Ryzen Threadripper 3000 khác, bao gồm hỗ trợ bộ nhớ DDR4 bốn kênh với tốc độ xung nhịp lên tới 3.200 MHz. Ngoài ra, khả năng kết nối ấn tượng của vi xử lý với 64 Lane 4.0 và 8 lane trong số đó được liên kết với chipset TRX40, điều này cung cấp cho người dùng thêm 16 lane PCI Express 4.0.

Và trong khi rất nhiều người mơ ước cũng như thèm khát con “quái vật” kể trên, một số tester kinh nghiệm và nổi tiếng trên thế giới đã và đang tìm cách “khống chế” con “quái vật” khi ngày đêm tìm cách phá vỡ những giới hạn mà nó mang lại. Chẳng hạn như việc tăng xung nhịp từ 4.3GHz lên thành 5.749GHz.  

Vậy họ đã làm bằng cách nào? Câu trả lời sẽ có trong ngày hôm nay khi chúng ta đọc bài chia sẻ của một “dân chơi” chuyên nghiệp và nổi tiếng thế giới – Allen ‘Splave’ Golibersuch, một dân chơi máy tính nổi tiếng ở Đức và cũng là một trong những Editor tại Tomshardware.

Trước tiên, để một vi xử lý có xung nhịp cao và số luồng lớn hoạt động một cách ổn định, điều đầu tiên là lựa chọn một hệ điều hành phù hợp. Splave chỉ sử dụng các hệ điều hành Window vì mục tiêu của anh ta đó chính là tạo ra các kỉ lục mới nhất được xác nhận. Theo đó, anh ấy đã dành nhiều tuần để sắp xếp các phiên bản khác nhau của Windows 10, Server, Enterprise, Pro, Build 19035, 1909, 1809, 1911… Dựa vào đó để tìm kiếm hệ điều hành tốt nhất nhằm xử lý tốt sức mạnh của con quái vật Ryzen Threadripper 3990X. Qua thực tế kiểm thử các benchmark khác nhau trên các hệ điều hành,  Splave đã nhận thấy các phiên bản Window Server 2019 1809 và 2012 mang lại hiệu suất tuyệt vời nhất. Tuy nhiên, để nhận ra được điều này thì Splave đã phải trải qua vô số thời gian, vô số thiết lập và cài đặt mới tìm ra được, điều này không hề đơn giản đối với những người không kiên trì và bản lĩnh.

Và như chúng ta có thể thấy, tất cả các thử nghiệm đã mang lại giá trị. Kỷ lục thế giới về benchmark HWBot 4K x265 dễ dàng đạt được trên hệ thống tản nhiệt bằng LN2. Trong benchmark này, 3990X được ép xung trên LN2 mang lại hiệu năng có thể nói nhanh bằng CPU Epyc trị giá 15.000 đô la của AMD.

 

Đối với việc ép xung cực đoan bằng LN2, nhiệt độ của Infinity Fabric thực sự là yếu tố hạn chế đối với vi xử lý Threadripper. Quá trình POST rất ghét (quá trình hoàn thành khởi động) nhiệt độ lạnh.

Đối với kỉ lục benchmark 4K x265, Splave muốn xem vi xử lý đạt được mức hiệu năng như thế nào khi hệ thống được làm mát bằng nước ở 0 độ C. Ngay cả ở 0C với Fabric có mức xung nhịp ở 1867 MHz, hệ thống đã gặp sự cố cho quá trình POST bởi temp quá thấp. Splave đã phải tắt máy bơm (giúp waterblock không nhận được dòng chảy của nước để nó nóng lên) nhằm cho quá trình POST ổn định để truy cập vào hệ điều hành. Khi ở trong HĐH, CPU sẽ phản hồi lại các nhịp độ lạnh như mong đợi: Vi xử lý chạy ở xung nhịp 4.5GHz trên tất cả 64 nhân và ở mức vCore 1.4, đạt mức cao nhất 1280 watt ở 0C.

Khi chúng ta làm mát hệ thống xung quanh đơn giản, Fabric có thể là 1867 MHz cả ngày mà không gặp sự cố nào.

Điều này dẫn đến một số thông tin khác mà Splave cũng cho biết, đó là việc ép xung bộ nhớ trên 3990X bị chậm lại so với 3970X. Việc thiết kế nhiều cụm die rõ ràng là khó khăn hơn. Ba hoặc bốn bộ vi xử lý 3970X mà Splave đã thử nghiệm đều có thể dễ dàng chạy xung nhịp bộ nhớ ở mức 4600-4800 MHz và độ trễ 14-14-14-14-1T, nhưng đối với 3990X thì việc chạy trên 4400 MHz đã không thành công. Trong khi Splave đã cố gắng giữ mức xung nhịp, mức xung IF và Uclock theo tỷ lệ 1: 1: 1.

Tùy thuộc vào việc may mắn của người dùng khi lựa chọn được một vi xử lý tốt, nhưng Splave cũng cho biết là mức xung nhịp của 3990X nằm trong phạm vi thoải mái là ở 4.3-4.4GHz với hệ thống tản nhiệt bằng nước custom. Với hệ thống tản nhiệt khí cao cấp nhất, mức xung nhịp thực sự cũng chỉ khoảng 4.0-4.1GHz mà thôi. Điều này đồng nghĩa với việc người dùng chi 4k đô la cho con quái vật này thì hãy cố gắng chi tiêu thêm một chút mua một hệ thống tản nhiệt xịn để đạt được hiệu năng tốt nhất.

Splave đã sử dụng hệ thống như sau nhằm đạt những kỉ lục mới nhất:

Trong đó, anh ấy đã sử dụng ASRock TRX40 Taichi để ép xung, đây là bo mạch chủ tương tự đã được sử dụng cho 3970X. ASRock đã thiết kế bo mạch này với mạch VRM với 16 phase điện và mỗi phase 90Amp nhằm hỗ trợ cho các vi xử lý 64 nhân một cách tốt nhất.
Trên thực tế,  Splave đã sử dụng hai bộ nguồn PSU Enermax Maxtytan 1250W (single rail, 104A) để cung cấp cho CPU tất cả những gì nó có thể “chén”. Đồng thời, anh ấy đã kết nối hai bộ nguồn này lại với nhau bằng một bộ chuyển đổi PSU kép khá cơ bản, chỉ báo hiệu nguồn cho bộ nguồn thứ nhất.

Mặc dù vậy, mọi thứ trở nên thú vị với bộ điều hợp 8 chân. Đây là các CPU 8 chân + PCIe 6 chân kết hợp với một đầu nối CPU 8 chân duy nhất. Chiến thuật cân bằng tải tốt nhất là lấy cáp PCIe 6 chân từ PSU một và cáp 8 chân CPU từ PSU hai và kết nối chúng với đầu nối 8 chân của bo mạch chủ.

Sau đó, Splave đã làm ngược lại cho bo mạch chủ 8 chân kết nối số hai. Do bo mạch chủ không được thiết kế để chạy hai PSU, tải không phải là phân chia 50/50%, nhưng sau một số thử nghiệm của các kết hợp khác nhau, thiết lập này đã cho Splave gần nhất với mức phân phối điện khoảng 35/65% cho cả hai . Biết rõ rằng một trong những bộ nguồn cung cấp có thể đạt đỉnh khoảng 1500W mà không gặp vấn đề gì với 3970X, đây là một trong những sự dự phòng đáng kể cho hệ thống khi ép xung.

GSkill đã thiết kế dòng bộ nhớ Neo dành riêng cho các hệ thống AMD, do đó, nó hỗ trợ độ trễ chặt chẽ và xung nhịp thấp hơn với kết quả xuất sắc. Splave đã thực hiện mức xung nhịp của bộ nhớ ở 3200 MHz với timing 11-11-11-11-1t hoặc 4400 MHz với timing 14-14-14-14-1T. Đồng thời mức cài điện áp mang lại rất thấp cho một bộ nhớ sử dụng IC B-die. Đây là một dòng bộ nhớ xuất sắc, vượt qua rất nhiều bộ nhớ sử dụng IC B-die trước đó.

Sử dụng chương trình benchmark Geekbench3 là mục tiêu đầu tiên của Splave cho việc sử dụng nitơ lỏng. Ở benchmark này mất gần 2 phút để hoàn thành. Tất nhiên, benchmark phụ khó nhất (Ray Trace) là một trong những benchmark cuối cùng vào khoảng 1:45. Tỉ lệ thất bại hoặc thành công là khoảng 10% cho một benchmark. Bạn có thể tưởng tượng việc cân bằng tải 1800W ở -160C trong gần hai phút không? Điều đó sử dụng khoảng 1,5 lít LN2 có giá khoảng 3 đô la mỗi lần chạy. Thật điên rồ?

Sau khi đạt kỷ lục thế giới trong Geekbench3, Splave đã tiến hành sang thử nghiệm với benchmark Cinebench R20. Bài kiểm tra kết thúc sau khoảng năm giây và trong khi tải khá nặng, hệ thống vẫn ổn định. Điểm số dao động khá nhiều, đó là điều bình thường đối với một thiết lập như vậy. Bộ nhớ trong các khe bên trong bị đóng băng cứng, và mọi thứ đều hoạt động tốt, Splave hoàn thành ngày thử nghiệm thứ nhất.

Ngày thử nghiệm thứ hai, Splave tiếp tục tiến hành sử dụng các benchmark trước đây mà anh đã từng vượt qua.  Wprime 1024m là phần mềm đầu tiên được chọn, lúc này anh ấy đặt mức xung nhịp của hệ thống tương tự như khi chạy benchmark Cinebench R20. Thật ngạc nhiên, vi xử lý chạy hết tốc độ lên tới 5.4 GHz với IF 1867 MHz.

IF đóng một vai trò to lớn trong hiệu suất của 3990X, nhưng đó là nguyên nhân cho sự ổn định của hệ thống khi ép xung cực đoan. Chúng ta cần nó chạy nhanh nhất có thể, nhưng, như đã nói vô số lần, IF thực sự ghét bị lạnh. Bộ xử lý đạt những gì Splave muốn gọi là giới hạn hiệu suất. Điều này rất rõ ràng trong Cinebench R20 khi anh ta chiến đấu với một trong những kỹ sư của AMD cho kỷ lục thế giới. Hiểu đơn giản rằng, IF có mức xung nhịp cao đồng nghĩa với xung nhịp của CPU thấp hơn, đó gọi là tỉ lệ nghịch.

Ở mức 1867 MHz cho IF, 5.1GHz là mức xung nhịp ổn định tối đa cho các nhân và mang lại số điểm 39.000 trong Cinebench R20. Nếu chúng ta hạ thấp mức xung nhịp của IF xuống 1600 MHz, lúc này xung nhịp CPU đạt được 5.27GHz và số điểm vẫn đạt là 39.000 điểm trong cùng một benchmark. Còn IF ở mức xung nhịp 1733 MHz, lúc này CPU sẽ vượt qua mức 5.2GHz nhưng điểm số vẫn sẽ đạt 39.000 điểm trong R20. Đây là lý do tại sao Splave gọi nó là giới hạn hiệu suất.

Chúng ta hoàn toàn có thể tránh giới hạn hiệu suất này bằng cách vô hiệu hóa SMT. Chẳng hạn có thể chạy IF ở mức xung nhịp  1867 MHz và tối đa hóa hiệu năng CPU cùng một lúc, như đã thấy trong kỷ lục thế giới wPrime ở mức 5. 4 GHz. Giảm tốc độ IF là không cần thiết.

Các kỉ lục thế giới được xác nhận:

Về mặt điện năng, ở mức 1.65 vCore, tùy thuộc vào benchmark, hệ thống đã ngốn từ 1200 đến 2000W. Khi chỉ chạy trong hệ điều hành, hệ thống đã sử dụng 375W, tương đương với mức năng lượng của Core i9-9900K khi đang tải. Kết quả là, chúng ta phải đổ nitơ lỏng liên tục trên hệ thống sử dụng 3990X từ lúc  bật nó cho đến khi tắt nguồn.

KẾT LUẬN: 
 

Trước hết, ở thị trường chuyên nghiệp, đây là một phần trình diễn chói sáng của AMD so với đối thủ của Intel. Thứ hai, sẽ rất khó để một ai đó mới bắt đầu bỏ ra số tiền 4K$ mua một vi xử lý này. Thứ ba, dường như Window không sẵn sàng cho một vi xử lý quái vật 64 nhân/128 luồng với xung nhịp cao như thế này. Vì vậy, câu hỏi đặt ra là ở phân khúc người tiêu dùng, bao nhiêu người sẽ sẵn sàng cho vi xử lý này?

Đừng hiểu lầm câu hỏi đặt ra đó, bởi chúng ta hãy nhìn vào điểm số đạt được. Bởi nó là quái vật thật sự, nơi sản phẩm được trưng bày phải là một nơi sang trọng chứ không phải là một cửa hàng tạp hóa Ngoài ra, 3990X đã chỉ ra một điều rằng, món hời mà AMD dành cho người dùng chính là Threadripper 3970X bởi giá sản phẩm chỉ ở mức 1999$.

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

0902.675.393