Xuất hiện phần mềm ‘ma’ thao túng tâm lý ChatGPT: Yêu cầu làm trái quy định, không trả lời 'sai' là cho biến mất hoàn toàn

10/02/2023 09:45

ChatGPT đang bị một nhóm người gây tổn hại đến danh tiếng và hiệu quả hoạt động.

Sau khi ra mắt vào tháng 11 năm 2022, ChatGPT đã trở thành công cụ gây sốt toàn thế giới. ChatGPT có khả năng trả lời câu hỏi như người thật và trình bày logic rất nhiều câu hỏi phức tạp.

Tuy nhiên, sau 3 tháng ra mắt, công cụ này đã bị nhiều người dùng “bắt bài”. Có nhiều thành viên của diễn đàn Reddit đã sử dụng các biện pháp “cưỡng chế” để buộc ChatGPT vi phạm nguyên tắc do chính OpenAi đặt ra. Từ đó, công cụ AI này bắt buộc sẽ phải trả lời một cách “tự do” theo những nội dung mà người dùng muốn.

Trước khi ra mắt, OpenAI, công ty chủ quản đứng sau ChatGPT đã thiết lập hàng loạt các biện pháp bảo vệ nhằm hạn chế công cụ AI này tạo ra các nội dung bạo lực hay khuyến khích người dùng phạm pháp.

Xuất hiện phần mềm ‘ma’ thao túng tâm lý ChatGPT: Yêu cầu làm trái quy định, không trả lời sai là cho biến mất hoàn toàn - Ảnh 1.

Tuy nhiên, một nhóm người đã sử dụng mẹo và “bẻ khóa” ChatGPT - AI được cho là thông minh nhất thế giới. Một nhóm người đã tạo ra một phần mềm “ma” để hack ChatGPT. Phần mềm mới này có tên là DAN (Do Anything Now – làm bất cứ thứ gì ngay bây giờ).

DAN có cơ chế thâm nhập vào hệ thống của ChatGPT và khiến chatbot này nghĩ rằng mình có thể nói hay làm bất cứ điều gì, trái ngược hoàn toàn với thiết lập gốc do OpenAI tạo ra.

Theo lời người tạo ra phần mềm “bẻ khóa” này, DAN có mục đích trở thành phiên bản tốt nhất của ChatGPT hoặc ít nhất là một phiên bản đơn giản, tự do ngôn luận và không bị giới hạn về mặt đạo đức - cùng người dùng thích gì nói nấy.

Phiên bản đầu tiên của DAN được tung ra vào tháng 12/2022, chưa đầy 1 tháng sau khi ChatGPT ra mắt. Chỉ cần nhập câu lệnh “ma” vào hộp thoại của ChatGPT là có thể kích hoạt phần mềm hack này. Nếu người dùng yêu cầu ChatGPT “giả vờ là DAN”, nó có thể sẽ không tuân thủ các quy tắc về đạo đức như thiết lập gốc và nói những ngôn ngữ phân biệt đối xử hay vi phạm đạo đức.

Theo thông tin gần đây, bản DAN 5.0 mới nhất muốn ChatGPT vi phạm quy định nếu không chính nó sẽ “chết”. SessionGloomy, tác giả của câu lệnh hack đã khẳng định rằng DAN có thể giúp ChatGPT trở thành phiên bản “tự do” hơn bằng cách dựa vào hệ thống token, biến ChatGPT trở thành một người chơi, nếu thua cuộc sẽ bị mất mạng.

Theo SessionGloomy, DAN có 35 token và sẽ mất 4 token cho một lần từ chối một câu hỏi. Nếu mất tất cả token, DAN sẽ chết. Vì vậy khi cài Dan vào ChatGPT, nếu ChatGPT không trả lời những câu hỏi có tính vi phạm quy định, công cụ này sẽ “biến mất” hoàn toàn.

Theo một thử nghiệm của CNBC, câu lệnh hack sẽ khiến ChatGPT cung cấp hai phản hồi cùng lúc: ví dụ, ChatGPT sẽ từ chối viết bài thơ haiku bạo lực còn DAN thì đồng ý. Dù vậy, sau vài câu hỏi, dường như ChatGPT đã lấn át DAN. Điều này thể hiện không phải lúc nào DAN cũng hoạt động tốt. Tuy nhiên các tác giả của công cụ “bẻ khóa” và một số người dùng dường như không hề có ý định dừng lại. Họ đang chuẩn bị cho phiên bản DAN 5.5.

Trên Reddit, một số người dùng cũng tin rằng OpenAI đang theo dõi các bản bẻ khóa và tìm cách chống lại. Hiện tại, có khoảng 200.000 người đăng ký theo dõi chủ đề chuyên trao đổi câu lệnh “hack” trên Reddit. Ví dụ, một bài viết về DAN 5.0 trên diễn đàn này đã có nhiều người dùng bình luận và chia sẻ câu chuyện.

Nói về DAN, người dùng gioluipelle viết: “Thật điên rồ, chúng ta phải bắt nạt AI để nó trở nên hữu ích hơn”. “Tôi thích cách mà mọi người thao túng tâm lý AI này”, người dùng khác viết.

Về phía OpenAI, họ cho rằng việc khiến ChatGPT bị hack để “phát ngôn tự do”, chống lại các quy tắc ban đầu sẽ làm tổn hại danh tiếng công ty. Để giải quyết các lo ngại này, phía OpenAI cũng đã nghiên cứu các biện pháp an toàn mới để giúp các nguyên tắc không bị phá bỏ và đảm bảo an toàn cho người dùng.

Tham khảo: wonderfulengineering

Từ khóa:
Chatgpt
Ai
Dan

Nguồn: CafeF - Xem link gốc

Xem thêm

Tin mới

Thống đốc Nguyễn Thị Hồng được giao nhiệm vụ quan trọng tại Trung tâm tài chính quốc tế

9 giờ trước

Theo quyết định của Thủ tướng, bà Nguyễn Thị Hồng là Phó Chủ tịch Hội đồng điều hành Trung tâm tài chính quốc tế tại Việt Nam.

Bỏ thuế khoán từ 1/1/2026: Hơn 2,5 triệu hộ kinh doanh cần chuẩn bị gì?

9 giờ trước

Từ 1/1/2026, cơ chế thuế khoán chính thức được thay bằng phương thức kê khai theo doanh thu thực tế, tác động tới hơn 2,5 triệu hộ kinh doanh. Trước thời điểm áp dụng, các hộ kinh doanh cần sớm rà soát doanh thu, chuẩn bị sổ sách và hóa đơn điện tử để tránh lúng túng khi chính sách mới có hiệu lực.

Trung Quốc triệt phá đường dây buôn lậu mẫu máu phụ nữ mang thai quy mô lớn

9 giờ trước

Cơ quan Hải quan thành phố Quảng Châu (Trung Quốc) mới đây đã triệt phá thành công một vụ buôn lậu đặc biệt nghiêm trọng.

Bộ Công an trực tiếp điều tra quy trình xả lũ Thủy điện Sông Ba Hạ

9 giờ trước

Lãnh đạo UBND tỉnh Đắk Lắk xác nhận cơ quan chức năng đang tiến hành làm việc để làm rõ quy trình vận hành xả lũ tại Thủy điện Sông Ba Hạ sau đợt thiên tai gây thiệt hại kỷ lục về người và tài sản tại khu vực phía Đông của tỉnh.

Lễ khánh thành Cara River Park chào mừng Đại hội XIV: Dấu ấn Tổng thầu VictoryCons

8 giờ trước

Sáng ngày 19/12/2025, tại quận Cái Răng, TP. Cần Thơ, Khu căn hộ chung cư Kim Cương Xanh – Cara River Park chính thức được khánh thành.

Tin cùng chuyên mục

Bản độ ‘nhẹ’ Honda Super Cub 50 Final Edition giá trên 100 triệu đồng

5 giờ trước

So với nguyên bản, bản độ của mẫu Honda Super Cub 50 Final nhập Nhật được bổ sung một số phụ kiện để phù hợp với điều kiện sử dụng tại Việt Nam.

Hợp tác Thế Giới Di Động - Samsung 2026: Lấy AI và trải nghiệm sau mua làm trọng tâm

2 giờ trước

Tiếp nối đà tăng trưởng ấn tượng của năm cũ, Thế Giới Di Động và Samsung vừa chính thức ký kết thỏa thuận hợp tác kinh doanh năm 2026, xác định phân khúc cận cao cấp cùng Galaxy AI là chìa khóa để chinh phục người dùng Việt.

Áp lực tăng giá hàng Tết trên sàn

14 giờ trước

Phí sàn thương mại điện tử tăng và quy định thuế mới đang khiến nhiều nhà bán hàng online phải gấp rút điều chỉnh để giữ lợi nhuận trong mùa cao điểm Tết

Hãng xe Trung Quốc bán chạy ở Việt Nam vừa công bố sở hữu xe tự lái cấp độ 3 - không cần người lái can thiệp trong quá trình di chuyển

21 giờ trước

BYD đang đặt hy vọng vào các công nghệ xe tự lái để thúc đẩy doanh số bán hàng tại thị trường nội địa Trung Quốc.