Được ca ngợi có trình độ ngang tiến sĩ, tại sao mô hình GPT-5 của OpenAI liên tục bị chê bai là kém cỏi?

Hiếm có người trình độ tiến sĩ nào không đếm được chính xác số chữ B trong từ "Blueberry" thế nhưng đấy lại là lỗi hay gặp của mô hình AI GPT-5, vốn được ca ngợi có trình độ tương đương tiến sĩ. Sau một thời gian dài chờ đợi, cuối cùng OpenAI đã ra mắt mô hình GPT-5 được ca ngợi hết lời của mình, nhưng hóa ra nó lại đánh dấu một chương đen tối cho công ty này.

Mặc dù trên giấy tờ, mô hình mới khoe khoang những cải tiến hiệu suất khiêm tốn, nhưng trải nghiệm thực tế sử dụng nó lại khiến nhiều người hâm mộ vô cùng thất vọng. Những lời chỉ trích phổ biến tập trung vào việc các câu trả lời quá ngắn gọn, chất lượng viết kém đi rõ rệt và thiếu đi tính cách riêng biệt. Trên hết, nhiều người lưu ý rằng dù được quảng bá có "trí tuệ cấp tiến sĩ", GPT-5 vẫn mắc những lỗi ngớ ngẩn như khăng khăng rằng có ba chữ B trong từ "blueberry".

Sự thất vọng này lớn đến mức các fan hâm mộ đã yêu cầu OpenAI khôi phục quyền truy cập vào mô hình trước đó GPT-4o, thứ mà công ty đã táo bạo gỡ bỏ khi ra mắt GPT-5. Điều đáng kinh ngạc là OpenAI đã phải nhượng bộ trước yêu cầu của người hâm mộ. Tóm lại, người dùng GPT-5 không hề cảm thấy như "một bước tiến đáng kể trên con đường đến AGI" như CEO Sam Altman đã khoe khoang.

Được ca ngợi có trình độ ngang tiến sĩ, tại sao mô hình GPT-5 của OpenAI liên tục bị chê bai là kém cỏi? - Ảnh 1

Bộ chuyển đổi mô hình

Có thể có một lý do thú vị đằng sau việc tại sao bản nâng cấp ChatGPT này lại cảm thấy thiếu thuyết phục đến vậy. Để hiểu rõ hơn về nguyên nhân gây ra tình trạng này, cần phải nhìn vào kiến trúc kỹ thuật mà OpenAI áp dụng. Công ty đã triển khai cơ chế "real-time router" tự động lựa chọn giữa các biến thể khác nhau như gpt-5-main, gpt-5-thinking, hoặc các phiên bản "mini" tùy theo độ phức tạp của câu hỏi.

Về mặt lý thuyết, đây là một ý tưởng thông minh nhằm tối ưu hóa tài nguyên và giảm chi phí vận hành. Tuy nhiên, thực tế lại cho thấy router hoạt động không ổn định, dẫn đến chất lượng đầu ra dao động thất thường. Nhiều người dùng phản ánh rằng GPT-5 đôi khi còn cho kết quả kém hơn cả GPT-4o, phiên bản tiền nhiệm của nó. Thậm chí CEO Sam Altman cũng phải thừa nhận có lỗi khi bộ chuyển đổi tự động bị hỏng, khiến GPT-5 "ngu ngốc hơn rất nhiều" trong một thời gian.

Vấn đề còn tồi tệ hơn khi dường như GPT-5 có xu hướng chuyển sang phiên bản "mini" cho hầu hết các câu trả lời mà người dùng không thể làm cách nào khác do tùy chọn các mô hình khác đã biến mất. Từ góc độ kinh doanh, việc OpenAI sử dụng các biến thể "mini" để xử lý những truy vấn đơn giản nhằm tiết kiệm tài nguyên có thể hiểu được. Khi đạt tới giới hạn sử dụng, hệ thống sẽ tự động chuyển sang các phiên bản mini có khả năng xử lý thấp hơn.

Mặc dù chiến lược này giúp giảm chi phí vận hành, nhưng lại tạo ra trải nghiệm không nhất quán cho người dùng. Họ có thể nhận được câu trả lời chất lượng cao ở lần đầu, nhưng lại gặp phải kết quả kém chất lượng ở những lần sau mà không hiểu nguyên nhân. Điều này càng làm gia tăng sự thất vọng và bất mãn trong cộng đồng người dùng. Chỉ sau khi nhận được sức ép mạnh mẽ từ cộng đồng, OpenAI mới khôi phục lại model picker với các lựa chọn "Auto", "Fast" và "Thinking", đồng thời cho phép người dùng Plus truy cập trở lại GPT-4o.

Được ca ngợi có trình độ ngang tiến sĩ, tại sao mô hình GPT-5 của OpenAI liên tục bị chê bai là kém cỏi? - Ảnh 2 — Sau phản đối từ người dùng, giờ đây OpenAI đã phải cho người dùng trả phí truy cập GPT-4o

Theo suy đoán của The Register, điều này có thể là do GPT-5 thực sự được thiết kế "một bước tiến bộ nhỏ và một bước tiến lớn trong việc tiết kiệm chi phí tính toán." Thậm chí, các chuyên gia từ MIT Technology Review và New Yorker cũng nhận định rằng GPT-5 thực chất chỉ là một bước cải tiến tinh chỉnh, chứ không phải cuộc cách mạng AI như OpenAI đã tuyên truyền. Đây là một giả thuyết đáng chú ý, khi nói đến việc OpenAI đang tìm cách phải có lợi nhuận vào cuối thập kỷ này.

Điểm quan trọng cần rút ra từ việc này là việc triển khai "bộ chuyển đổi tự động" này đã đi chệch khỏi cách tiếp cận của OpenAI trong quá khứ, như The Register lưu ý, trước đây cho phép người dùng trả phí đơn giản chọn mô hình họ muốn sử dụng, thay vì để nó được chọn tự động. Tuy nhiên, việc giữ tất cả các mô hình đó trực tuyến rất tốn kém, củng cố ý tưởng rằng nhà sản xuất ChatGPT đang trải qua một số biện pháp thắt lưng buộc bụng bằng cách loại bỏ chúng, mặc dù sau đó đã đảo ngược quyết định và khôi phục quyền truy cập cho người dùng trả phí.

Chiêu tinh vi để cắt giảm chi phí

Có những dấu hiệu rõ ràng khác của việc cắt giảm chi phí, như giới hạn nghiêm ngặt chỉ mười tin nhắn mỗi giờ cho người dùng miễn phí. OpenAI cũng đang giữ "cửa sổ ngữ cảnh" của mô hình - về cơ bản là bộ nhớ của nó - giống như trước, giới hạn ở 32.000 token cho người dùng Plus và 128.000 cho Pro. Các fan hâm mộ, đặc biệt là những người ở tầng Plus - với mức phí 20 USD là tầng duy nhất có thể chi trả được đối với hầu hết mọi người, vì Pro sẽ tốn 200 USD mỗi tháng - đã van xin được nâng cấp trong lĩnh vực này.

Được ca ngợi có trình độ ngang tiến sĩ, tại sao mô hình GPT-5 của OpenAI liên tục bị chê bai là kém cỏi? - Ảnh 3

Việc GPT-5 đại diện cho sự cắt tỉa đằng sau hậu trường tại công ty chắc chắn đã là lý thuyết được nhiều fan hâm mộ của nó tin tưởng, với một trong những bài đăng hàng đầu trên subreddit r/ChatGPT khẳng định rằng GPT-5 "rõ ràng là một bài tập tiết kiệm chi phí." Người dùng viết: "Họ đã loại bỏ tất cả các mô hình đắt tiền, có khả năng của mình và thay thế chúng bằng một auto-router mặc định để tối ưu hóa chi phí. Điều đó nghe có vẻ tệ, vì vậy họ gói nó lại như GPT-5 và tuyên bố nó thật tuyệt vời."

Một người dùng khác kết luận: "Cảm giác như tiết kiệm chi phí, chứ không phải như cải tiến." Dù không hào nhoáng, nhưng việc cắt giảm chi phí vào thời điểm này có ý nghĩa từ quan điểm của OpenAI . Công ty đang đối mặt với sự cạnh tranh nhiều hơn bao giờ hết và đang chịu áp lực ngày càng tăng để tìm cách biến mô hình kinh doanh của mình thành có lợi nhuận.

Định giá dự kiến khoảng 500 tỷ USD của họ đi kèm với kỳ vọng ngầm rằng họ sẽ tìm ra cách kiếm tiền sớm. Nhưng công ty rõ ràng đã đánh giá thấp mức độ gắn bó cuồng nhiệt của các fan đối với những đặc điểm kỳ quặc của các mô hình cũ, ngay cả khi chúng về mặt danh nghĩa kém hơn - và đó không phải là một vấn đề sẽ biến mất sớm.

Thực tế này đặt ra câu hỏi lớn hơn về chiến lược của OpenAI và liệu công ty có thể cân bằng được giữa áp lực tài chính và kỳ vọng của người dùng hay không. Nếu lý thuyết về việc cắt giảm chi phí là đúng, thì GPT-5 có thể chỉ là khởi đầu của một xu hướng đáng lo ngại, nơi các cải tiến kỹ thuật bị hy sinh vì lợi ích kinh tế ngắn hạn.

Trong bối cảnh cạnh tranh khốc liệt của ngành AI, việc OpenAI lựa chọn con đường này có thể mở ra cơ hội cho các đối thủ cạnh tranh khác vượt lên về mặt kỹ thuật. Liệu chiến lược "tối ưu hóa chi phí" này sẽ giúp OpenAI đạt được lợi nhuận hay sẽ khiến họ mất đi vị thế dẫn đầu trong cuộc đua AI vẫn còn là một câu hỏi mở, và câu trả lời có thể quyết định tương lai không chỉ của OpenAI mà của toàn bộ ngành công nghiệp trí tuệ nhân tạo.