Ngành công nghiệp trí tuệ nhân tạo của Trung Quốc đang âm thầm chuyển hướng sang các GPU NVIDIA đã qua sử dụng và tân trang sau khi các hạn chế mới đối với chip gia tốc H20 khiến khách hàng phải tranh thủ tìm kiếm các giải pháp thay thế. Chip H20, một phiên bản GPU dựa trên Hopper được thiết kế đặc biệt để tuân thủ các hạn chế xuất khẩu của Mỹ, vốn được kỳ vọng sẽ giúp NVIDIA duy trì vị trí trên thị trường Trung Quốc.
Tuy nhiên, chip này đã bị loại bỏ sau khi việc xuất khẩu H20 được nối lại vào tháng 7, sau khi các cơ quan quản lý Trung Quốc đặt ra mối lo ngại về bảo mật dữ liệu và thực tế cấm việc mua chip này. Theo báo cáo gần đây của Digitimes, điều này đã dẫn đến nhu cầu tăng vọt đối với các card A100 và H100 cũ khi các công ty tháo rời và cấu hình lại chúng thành các hệ thống suy luận tùy chỉnh "chi phí thấp, hiệu suất cao".
Chip AI H20 của NVIDIA bị Trung Quốc cấm sử dụng do lo ngại bảo mật dữ liệu
Việc sử dụng chip cũ trở nên khả thi bởi vì quá trình suy luận ít tốn kém về mặt tính toán hơn so với training. Các mô hình không yêu cầu độ chính xác floating-point đầy đủ và khối lượng công việc có thể chạy hiệu quả trên phần cứng đã được cắt giảm hoặc cấu hình lại. Chính vì vậy mà ngay cả A100, được ra mắt từ năm 2020, vẫn có giá trị trong một số trường hợp sử dụng.
Chip A100 được xây dựng trên kiến trúc Ampere của NVIDIA, với bộ nhớ HBM2e lên đến 80GB và băng thông 2 TBps. Mặc dù thiếu thông lượng đỉnh của Hopper, nó vẫn rất hiệu quả đối với các tác vụ suy luận nhờ vào bộ nhớ lớn và hệ sinh thái phần mềm CUDA đã hoàn thiện. Đối với các khối lượng công việc như chatbot và hệ thống khuyến nghị, các nhà phát triển vẫn có thể đạt được kết quả hiệu quả về chi phí mà không cần silicon tiên tiến nhất.
Chip H100, được ra mắt vào năm 2022, có hiệu suất cao hơn đáng kể với bộ nhớ HBM3 và thông lượng training AI cao gấp sáu lần so với A100. Ngược lại, H20 được điều chỉnh cho suy luận nhưng bị cắt giảm một cách quá mức đến nỗi nó chỉ đạt được hiệu suất AI thấp hơn từ ba đến gần bảy lần so với H100 đầy đủ, và chậm hơn ba mươi lần trong các tác vụ siêu tính toán FP64. Trên thực tế, điều này khiến ngay cả những A100 được tái sử dụng cũng trở thành lựa chọn hấp dẫn hơn cho người mua Trung Quốc so với H20 mới.
Điều đó làm nhu cầu đôi với chip AI H100 đã qua sử dụng tăng vọt
Với hệ sinh thái CUDA của NVIDIA vẫn không có đối thủ, các card cũ vẫn dễ dàng cắm và chạy đối với các nhà phát triển. Và bởi vì phần cứng suy luận có thể chạy suốt ngày đêm với rủi ro mất độ chính xác thấp hơn, các trung tâm dữ liệu của Trung Quốc rõ ràng sẵn sàng trả tiền cho các bo mạch tân trang ngay cả khi độ tin cậy giảm.
Tình huống này đặt NVIDIA vào một thế bí khó lạ. Công ty đã phải xóa sổ 5.5 tỷ USD hàng tồn kho H20 chưa bán được khi Washington đưa ra yêu cầu cấp phép cho việc xuất khẩu sang Trung Quốc. Tuy nhiên, một cách nghịch lý, các GPU của họ vẫn là chất xúc tác của sự bùng nổ AI đang diễn ra ở Trung Quốc. Đây là con dao hai lưỡi đối với NVIDIA: Chip của họ vẫn thống trị, nhưng các kênh thị trường xám có nguy cơ làm xói mòn lợi nhuận và làm chậm việc áp dụng các kiến trúc mới hơn.
Nhiều nơi thậm chí còn tái sử dụng các GPU dân dụng để làm công cụ vận hành AI
Thị trường xám cũng là vấn đề cực kỳ lớn đối với Bắc Kinh, vốn mong muốn các công ty cạnh tranh nội địa như Huawei và Biren phát triển mạnh. Mỗi H100 cũ được tháo rời và lắp đặt trong một trung tâm dữ liệu Trung Quốc là một hệ thống khác không chạy trên các bộ tăng tốc Ascend, điều này có thể làm chậm các khoản đầu tư nội địa.
Cuối cùng, làn sóng GPU tái chế minh họa cho những hậu quả ngoài ý muốn của việc thắt chặt kiểm soát xuất khẩu. Các nhà hoạch định chính sách Mỹ hy vọng sẽ hạn chế quyền truy cập của Trung Quốc vào khả năng tính toán tiên tiến, trong khi Bắc Kinh đã tìm cách đẩy nhanh việc áp dụng silicon nội địa. Thay vào đó, kết quả là một nền kinh tế tái chế nơi các A100 và H100 của ngày hôm qua tiếp tục cung cấp năng lượng cho các triển khai AI của ngày mai.
Hiện tại, ngành công nghiệp AI của Trung Quốc đang xoay xở với chủ nghĩa thực dụng, kéo dài tuổi thọ hữu ích của phần cứng NVIDIA cũ trong khi chờ đợi cả các rào cản chính trị và công nghệ được dọn sạch.