Được ca ngợi có trình độ ngang tiến sĩ, tại sao mô hình GPT-5 của OpenAI liên tục bị chê bai là kém cỏi?

1 ngày trước
Bất chấp lời ca ngợi từ OpenAI, hóa ra mô hình AI GPT-5 lại gây thất vọng lớn cho người dùng đến mức buộc OpenAI phải thay đổi và đưa trở lại mô hình AI 4o cũ để xoa dịu họ.

Hiếm có người trình độ tiến sĩ nào không đếm được chính xác số chữ B trong từ "Blueberry" thế nhưng đấy lại là lỗi hay gặp của mô hình AI GPT-5, vốn được ca ngợi có trình độ tương đương tiến sĩ. Sau một thời gian dài chờ đợi, cuối cùng OpenAI đã ra mắt mô hình GPT-5 được ca ngợi hết lời của mình, nhưng hóa ra nó lại đánh dấu một chương đen tối cho công ty này.

Mặc dù trên giấy tờ, mô hình mới khoe khoang những cải tiến hiệu suất khiêm tốn, nhưng trải nghiệm thực tế sử dụng nó lại khiến nhiều người hâm mộ vô cùng thất vọng. Những lời chỉ trích phổ biến tập trung vào việc các câu trả lời quá ngắn gọn, chất lượng viết kém đi rõ rệt và thiếu đi tính cách riêng biệt. Trên hết, nhiều người lưu ý rằng dù được quảng bá có "trí tuệ cấp tiến sĩ", GPT-5 vẫn mắc những lỗi ngớ ngẩn như khăng khăng rằng có ba chữ B trong từ "blueberry".

Sự thất vọng này lớn đến mức các fan hâm mộ đã yêu cầu OpenAI khôi phục quyền truy cập vào mô hình trước đó GPT-4o, thứ mà công ty đã táo bạo gỡ bỏ khi ra mắt GPT-5. Điều đáng kinh ngạc là OpenAI đã phải nhượng bộ trước yêu cầu của người hâm mộ. Tóm lại, người dùng GPT-5 không hề cảm thấy như "một bước tiến đáng kể trên con đường đến AGI" như CEO Sam Altman đã khoe khoang.

Được ca ngợi có trình độ ngang tiến sĩ, tại sao mô hình GPT-5 của OpenAI liên tục bị chê bai là kém cỏi? - Ảnh 1

Bộ chuyển đổi mô hình

Có thể có một lý do thú vị đằng sau việc tại sao bản nâng cấp ChatGPT này lại cảm thấy thiếu thuyết phục đến vậy. Để hiểu rõ hơn về nguyên nhân gây ra tình trạng này, cần phải nhìn vào kiến trúc kỹ thuật mà OpenAI áp dụng. Công ty đã triển khai cơ chế "real-time router" tự động lựa chọn giữa các biến thể khác nhau như gpt-5-main, gpt-5-thinking, hoặc các phiên bản "mini" tùy theo độ phức tạp của câu hỏi. 

Về mặt lý thuyết, đây là một ý tưởng thông minh nhằm tối ưu hóa tài nguyên và giảm chi phí vận hành. Tuy nhiên, thực tế lại cho thấy router hoạt động không ổn định, dẫn đến chất lượng đầu ra dao động thất thường. Nhiều người dùng phản ánh rằng GPT-5 đôi khi còn cho kết quả kém hơn cả GPT-4o, phiên bản tiền nhiệm của nó. Thậm chí CEO Sam Altman cũng phải thừa nhận có lỗi khi bộ chuyển đổi tự động bị hỏng, khiến GPT-5 "ngu ngốc hơn rất nhiều" trong một thời gian.

Vấn đề còn tồi tệ hơn khi dường như GPT-5 có xu hướng chuyển sang phiên bản "mini" cho hầu hết các câu trả lời mà người dùng không thể làm cách nào khác do tùy chọn các mô hình khác đã biến mất. Từ góc độ kinh doanh, việc OpenAI sử dụng các biến thể "mini" để xử lý những truy vấn đơn giản nhằm tiết kiệm tài nguyên có thể hiểu được. Khi đạt tới giới hạn sử dụng, hệ thống sẽ tự động chuyển sang các phiên bản mini có khả năng xử lý thấp hơn.

Mặc dù chiến lược này giúp giảm chi phí vận hành, nhưng lại tạo ra trải nghiệm không nhất quán cho người dùng. Họ có thể nhận được câu trả lời chất lượng cao ở lần đầu, nhưng lại gặp phải kết quả kém chất lượng ở những lần sau mà không hiểu nguyên nhân. Điều này càng làm gia tăng sự thất vọng và bất mãn trong cộng đồng người dùng. Chỉ sau khi nhận được sức ép mạnh mẽ từ cộng đồng, OpenAI mới khôi phục lại model picker với các lựa chọn "Auto", "Fast" và "Thinking", đồng thời cho phép người dùng Plus truy cập trở lại GPT-4o.

Được ca ngợi có trình độ ngang tiến sĩ, tại sao mô hình GPT-5 của OpenAI liên tục bị chê bai là kém cỏi? - Ảnh 2

Sau phản đối từ người dùng, giờ đây OpenAI đã phải cho người dùng trả phí truy cập GPT-4o

Theo suy đoán của The Register, điều này có thể là do GPT-5 thực sự được thiết kế "một bước tiến bộ nhỏ và một bước tiến lớn trong việc tiết kiệm chi phí tính toán." Thậm chí, các chuyên gia từ MIT Technology Review và New Yorker cũng nhận định rằng GPT-5 thực chất chỉ là một bước cải tiến tinh chỉnh, chứ không phải cuộc cách mạng AI như OpenAI đã tuyên truyền. Đây là một giả thuyết đáng chú ý, khi nói đến việc OpenAI đang tìm cách phải có lợi nhuận vào cuối thập kỷ này.

Điểm quan trọng cần rút ra từ việc này là việc triển khai "bộ chuyển đổi tự động" này đã đi chệch khỏi cách tiếp cận của OpenAI trong quá khứ, như The Register lưu ý, trước đây cho phép người dùng trả phí đơn giản chọn mô hình họ muốn sử dụng, thay vì để nó được chọn tự động. Tuy nhiên, việc giữ tất cả các mô hình đó trực tuyến rất tốn kém, củng cố ý tưởng rằng nhà sản xuất ChatGPT đang trải qua một số biện pháp thắt lưng buộc bụng bằng cách loại bỏ chúng, mặc dù sau đó đã đảo ngược quyết định và khôi phục quyền truy cập cho người dùng trả phí.

Chiêu tinh vi để cắt giảm chi phí

Có những dấu hiệu rõ ràng khác của việc cắt giảm chi phí, như giới hạn nghiêm ngặt chỉ mười tin nhắn mỗi giờ cho người dùng miễn phí. OpenAI cũng đang giữ "cửa sổ ngữ cảnh" của mô hình - về cơ bản là bộ nhớ của nó - giống như trước, giới hạn ở 32.000 token cho người dùng Plus và 128.000 cho Pro. Các fan hâm mộ, đặc biệt là những người ở tầng Plus - với mức phí 20 USD là tầng duy nhất có thể chi trả được đối với hầu hết mọi người, vì Pro sẽ tốn 200 USD mỗi tháng - đã van xin được nâng cấp trong lĩnh vực này.

Được ca ngợi có trình độ ngang tiến sĩ, tại sao mô hình GPT-5 của OpenAI liên tục bị chê bai là kém cỏi? - Ảnh 3

Việc GPT-5 đại diện cho sự cắt tỉa đằng sau hậu trường tại công ty chắc chắn đã là lý thuyết được nhiều fan hâm mộ của nó tin tưởng, với một trong những bài đăng hàng đầu trên subreddit r/ChatGPT khẳng định rằng GPT-5 "rõ ràng là một bài tập tiết kiệm chi phí." Người dùng viết: "Họ đã loại bỏ tất cả các mô hình đắt tiền, có khả năng của mình và thay thế chúng bằng một auto-router mặc định để tối ưu hóa chi phí. Điều đó nghe có vẻ tệ, vì vậy họ gói nó lại như GPT-5 và tuyên bố nó thật tuyệt vời."

Một người dùng khác kết luận: "Cảm giác như tiết kiệm chi phí, chứ không phải như cải tiến." Dù không hào nhoáng, nhưng việc cắt giảm chi phí vào thời điểm này có ý nghĩa từ quan điểm của OpenAI . Công ty đang đối mặt với sự cạnh tranh nhiều hơn bao giờ hết và đang chịu áp lực ngày càng tăng để tìm cách biến mô hình kinh doanh của mình thành có lợi nhuận.

Định giá dự kiến khoảng 500 tỷ USD của họ đi kèm với kỳ vọng ngầm rằng họ sẽ tìm ra cách kiếm tiền sớm. Nhưng công ty rõ ràng đã đánh giá thấp mức độ gắn bó cuồng nhiệt của các fan đối với những đặc điểm kỳ quặc của các mô hình cũ, ngay cả khi chúng về mặt danh nghĩa kém hơn - và đó không phải là một vấn đề sẽ biến mất sớm.

Thực tế này đặt ra câu hỏi lớn hơn về chiến lược của OpenAI và liệu công ty có thể cân bằng được giữa áp lực tài chính và kỳ vọng của người dùng hay không. Nếu lý thuyết về việc cắt giảm chi phí là đúng, thì GPT-5 có thể chỉ là khởi đầu của một xu hướng đáng lo ngại, nơi các cải tiến kỹ thuật bị hy sinh vì lợi ích kinh tế ngắn hạn.

Trong bối cảnh cạnh tranh khốc liệt của ngành AI, việc OpenAI lựa chọn con đường này có thể mở ra cơ hội cho các đối thủ cạnh tranh khác vượt lên về mặt kỹ thuật. Liệu chiến lược "tối ưu hóa chi phí" này sẽ giúp OpenAI đạt được lợi nhuận hay sẽ khiến họ mất đi vị thế dẫn đầu trong cuộc đua AI vẫn còn là một câu hỏi mở, và câu trả lời có thể quyết định tương lai không chỉ của OpenAI mà của toàn bộ ngành công nghiệp trí tuệ nhân tạo.

Tin mới

Trung Quốc qua mặt thế giới, tìm ra cách làm "siêu pin": Xe điện giờ đi xa hơn 1.000km, vượt cả xe xăng?
6 giờ trước
Loại pin mới của Trung Quốc khi được đưa vào sử dụng trên quy mô lớn có thể tăng gấp đôi, thậm chí gấp bốn lần phạm vi hoạt động của xe điện
MIT từng dự báo xã hội hiện đại sẽ sụp đổ vào năm 2040 - và thế giới đang đi đúng hướng đó
6 giờ trước
Báo cáo của Herrington cho thấy một lần nữa rằng những cảnh báo từ 50 năm trước vẫn còn nguyên giá trị - và rằng con đường nhân loại chọn trong thập kỷ tới sẽ mang tính quyết định cho tương lai của cả nền văn minh.
Chuyện ở 'garage' THACO: Ông chủ Trần Bá Dương xắn tay 'độ' lại siêu xe đa dụng
6 giờ trước
Hãy tưởng tượng chiếc xe THACO đang cần một cuộc đại tu, không phải để sửa chữa, mà là để nâng cấp toàn diện. Ông Trần Bá Dương muốn thay thế "động cơ" cũ bằng một hệ thống truyền động hybrid hoàn toàn mới.
Sự thật đằng sau những con robot hình người ‘made in China’: Đi không vững, cần tới 17 phút để bỏ 9 mảnh rác, lấy 3 hộp thuốc mất 5 phút
6 giờ trước
Đằng sau sự hào nhoáng là những rào cản không nhỏ.
Lượng người sử dụng ChatGPT có thời điểm giảm tới 70%, lý do là gì?
5 giờ trước
Lượng người truy cập ChatGPT đã giảm tới 70% từ đầu tháng 6 và giữ ở mức này cho đến tận đầu tháng 8.

Bảng giá cập nhật trực tuyến

Cao su

RUBBER

37.268.452 VNĐ / tấn

170.30 JPY / kg

0.58 %

- 1.00

Đường

SUGAR

9.449.487 VNĐ / tấn

16.30 UScents / lb

0.31 %

+ 0.05

Cacao

COCOA

215.283.697 VNĐ / tấn

8,187.00 USD / mt

0.04 %

+ 3.00

Cà phê Arabica

COFFEE ARABICA

207.952.476 VNĐ / tấn

358.71 UScents / lb

4.40 %

+ 15.11

Gạo

RICE

14.974 VNĐ / tấn

12.52 USD / CWT

0.56 %

- 0.07

Đậu nành

SOYBEANS

9.785.723 VNĐ / tấn

1,012.80 UScents / bu

0.78 %

- 8.00

Bột đậu nành

SOYBEAN MEAL

8.571.207 VNĐ / tấn

295.70 USD / ust

1.34 %

+ 3.90

» Xem tất cả giá Nông sản

Tin cùng chuyên mục

Xe robotaxi Trung Quốc chuẩn bị đổ bộ vào Anh
5 giờ trước
Sau khi phủ sóng đường phố Bắc Kinh, các xe tự lái của Trung Quốc có thể sẽ chuẩn bị xuất hiện trên đường phố Anh ngay trong năm tới.
Mỹ chi 2,2 tỷ USD đưa 350.000 tấm gương ra giữa sa mạc, dự án vĩ đại sụp đổ sau 1 thập kỷ: Trung Quốc làm được trong vỏn vẹn 2 năm
5 giờ trước
Nhà máy điện mặt trời Ivanpah Solar Electric Generating System - một trong những công trình năng lượng mặt trời tập trung lớn nhất thế giới ở Mỹ, nay đang đối mặt với viễn cảnh đóng cửa chỉ sau 11 năm đi vào hoạt động. Trong khi đó, Trung Quốc phát triển thành công công nghệ tương tự chỉ trong thời gian ngắn.
Nếu gỡ được việc này, kinh tế Cuba có thể thu được gần 3 tỷ USD/năm
4 giờ trước
Kinh tế Cuba cần được cải thiện.
'Vua pin' Trung Quốc sẽ xây 10.000 trạm đổi pin xe điện vào năm 2028: Phục vụ 1 triệu xe mỗi ngày, mọi thao tác đều tự động, mất vỏn vẹn 3 phút
4 giờ trước
Các trạm đổi pin xe điện sẽ sớm xuất hiện đại trà tại Trung Quốc.