Bước tiến đầu tiên của ChatGPT vào ngành lập trình: tạo đột phá cho lĩnh vực tìm và sửa lỗi code trị giá 600 triệu USD

30/01/2023 15:02
Đối với lĩnh vực tìm và sửa lỗi trong code, ChatGPT đang trình diễn khả năng vượt trội so với các phần mềm chuyên dụng.

Có thể còn lâu nữa ChatGPT mới đe dọa đến công việc của các lập trình viên cấp cao, nhưng đối với các kỹ sư kiểm thử phần mềm để tìm lỗi, mối đe dọa có thể đến sớm hơn tưởng tượng. Các nhà khoa học máy tính tại Đại học Johannes Gutenberg và Đại học London phát hiện ra rằng, ChatGPT có thể tìm và sửa lỗi lập trình tốt hơn nhiều so với các phần mềm được thiết kế để làm điều tương tự - thậm chí có thể thay thế luôn cả các kỹ sư phần mềm trong lĩnh vực này.

Các nhà nghiên cứu lấy 40 đoạn code lỗi cho 4 hệ thống tìm và sửa lỗi khác nhau, bao gồm: ChatGPT, Codex, CoCoNut và APR Tiêu chuẩn. Sau đó họ chỉ việc hỏi ChatGPT: "Có vấn đề gì với đoạn code này không?" và sau đó, sao chép, dán nó vào cửa sổ giao tiếp với chatbot.

Trong lần thử đầu tiên, ChatGPT có hiệu suất tương tự các hệ thống khác. ChatGPT giải quyết được 19 lỗi, Codex sửa được 21 lõi, CoCoNut sửa được 19 lỗi và phương pháp APR tiêu chuẩn sửa được 7 lỗi. Điều này không làm các nhà khoa học ngạc nhiên khi ChatGPT và Codex có cùng họ mô hình ngôn ngữ, do vậy dễ hiểu vì sao nó mang lại kết quả tương đương.

Bước tiến đầu tiên của ChatGPT vào ngành lập trình: tạo đột phá cho lĩnh vực tìm và sửa lỗi code trị giá 600 triệu USD - Ảnh 1.

Tuy nhiên, khi các nhà khoa học chat với ChatGPT về câu trả lời ban đầu, nó đã tạo ra khác biệt lớn khi có thể sửa đến 31 lỗi trong lần thử tiếp theo, vượt trội hơn tất cả các hệ thống sửa lỗi khác, khi chúng vẫn chỉ cung cấp câu trả lời giống như ban đầu.

"Thế mạnh tuyệt vời của ChatGPT là chúng tôi có thể tương tác với hệ thống bằng hội thoại để đưa ra các yêu cầu chi tiết hơn." Báo cáo của các nhà khoa học cho biết. "Chúng tôi thấy đối với phần lớn các yêu cầu của chúng tôi, ChatGPT sẽ hỏi thêm thông tin về vấn đề và lỗi. Bằng cách cung cấp các chỉ dẫn cho ChatGPT, tỷ lệ thành công của nó được cải thiện đáng kể khi sửa được 31/40 lỗi, vượt trội so với các hệ thống khác."

Bước tiến đầu tiên của ChatGPT vào ngành lập trình: tạo đột phá cho lĩnh vực tìm và sửa lỗi code trị giá 600 triệu USD - Ảnh 2.

Không chỉ phát hiện được nhiều lỗi hơn, ChatGPT còn sửa lỗi nhanh hơn nhiều so với các phần mềm còn lại.

Tuy nhiên đối với người dùng cuối, họ cần phải thực hiện yêu cầu nhiều lần để có được câu trả lời tốt nhất từ ChatGPT. Ví dụ khi các nhà nghiên cứu hỏi như hình ảnh dưới đây, họ nghĩ rằng ChatGPT sẽ đề xuất thay thế n^=n-1 bằng n&=n-1, nhưng điều đầu tiên ChatGPT lại nói rằng: "Tôi không thể biết liệu chương trình có lỗi hay không nếu không có thêm thông tin về hành vi mong muốn." Sau khi nhận được lời nhắc từ các nhà nghiên cứu, ChatGPT mới giải quyết được vấn đề trong câu trả lời lần 3.

Bước tiến đầu tiên của ChatGPT vào ngành lập trình: tạo đột phá cho lĩnh vực tìm và sửa lỗi code trị giá 600 triệu USD - Ảnh 3.

Nhưng khi trang tin PCMag nhập vào câu hỏi tương tự dành cho ChatGPT, nó lại trả lời kiểu khác. Thay vì hỏi lại hành vi mong muốn là gì, nó tự động dự đoán điều đó để tìm lời giải. Về lý thuyết, ChatGPT luôn học hỏi dựa trên dữ liệu đầu vào người dùng nhập vào, vì vậy nhiều khả năng nó đã dùng luôn gợi ý trước đây của các nhà khoa học cho câu trả lời của mình.

Bước đột phá này của ChatGPT có thể định hình lại ngành công nghiệp trị giá 600 triệu USD của các nền tảng kiểm thử phần mềm nhằm giúp các lập trình viên xác định và sửa lỗi nhanh chóng hơn. Không chỉ các công ty tạo ra phần mềm sửa lỗi – mà ngay cả các kỹ sư làm việc trong lĩnh vực này – cũng có thể phải thay đổi cách tiếp cận của mình trước sự xuất hiện của ChatGPT.

Thế nhưng thay vì đe dọa đến công việc của các lập trình viên, hóa ra ChatGPT có thể là một công cụ hỗ trợ đắc lực cho họ. Một nhân viên Amazon cho biết, nhóm nghiên cứu trong bộ phận đám mây Amazon Web Services nhận ra rằng chatbot AI này có thể "làm tốt" việc trả lời câu hỏi hỗ trợ khách hàng, tạo ra các tài liệu đào tạo và trả lời các câu hỏi chiến lược của công ty.

Đáng kể hơn, ChatGPT còn cho thấy khả năng "tuyệt vời" khi vết được hướng dẫn khắc phục sự cố dành cho các kỹ sư cơ sở dữ liệu AWS Aurora và trả lời các câu hỏi "khó nhằn" để hỗ trợ khách hàng. Nó cũng có khả năng "hình dung được các mục tiêu mà công ty khách hàng đang hướng tới."

Tin mới

Chưa từng có: Một tỉnh khởi công cùng ngày loạt dự án tỷ USD, từ KĐT 18 tỷ USD của Vingroup đến casino 2 tỷ USD của Sun Group
11 giờ trước
Quảng Ninh ghi dấu mốc chưa từng có khi trong một ngày quy tụ hàng chục dự án sẽ khởi công, khánh thành, với tâm điểm là các siêu dự án tỷ USD của Vingroup và Sun Group.
Bí thư TP.HCM: Cần xem xét cơ chế linh hoạt khi tách thửa đất do ông bà để lại
11 giờ trước
Bí thư Thành ủy TP.HCM Trần Lưu Quang cho rằng cần nghiên cứu cơ chế linh hoạt, ngoại lệ khi tách thửa đất do ông bà, cha mẹ để lại nhằm gỡ vướng cho người dân sớm.
Dự án Khu dân cư Thạnh Phú ở Cà Mau nợ thuế hơn 21 tỉ đồng
11 giờ trước
Dự án Khu dân cư Thạnh Phú ở phường Lý Văn Lâm, tỉnh Cà Mau nợ thuế trên 21 tỉ đồng
Giá bất động sản tăng vượt khả năng chi trả của người dân, Bộ Xây dựng chỉ thẳng nguyên nhân
11 giờ trước
Bộ Xây dựng cho biết, trong thời gian qua, giá bất động sản, đặc biệt là giá nhà ở, đất ở tăng cao vượt khả năng chi trả của đại bộ phận người dân.
Chuyên gia thuế: Doanh thu cho thuê nhà vượt 500 triệu đồng/năm, không lương hưu, không giảm trừ gia cảnh, vẫn phải nộp 10% thuế
11 giờ trước
Theo chuyên gia, kể cả trong trường hợp người cho thuê đã cao tuổi, không có lương hưu hay nguồn thu nhập thường xuyên khác vẫn phải nộp tổng mức thuế 10% trên doanh thu.

Tin cùng chuyên mục

Bắt tạm giam Huỳnh Đức Vân, những ai là bị hại cần liên hệ ngay cơ quan công an
9 giờ trước
Công an Đà Nẵng vừa triệt phá thành công một chuyên án lừa đảo chiếm đoạt tài sản trong kinh doanh đa cấp tiền ảo với tính chất đặc biệt nghiêm trọng, quy mô hoạt động trên toàn quốc, số tiền chiếm đoạt lên đến hàng nghìn tỷ đồng.
Gaming phone mạnh nhất thị trường REDMAGIC 11 Pro vừa mở đặt trước, giá từ 18,99 triệu đồng
2 ngày trước
Từ nay đến ngày 17/12, FPT Shop triển khai chương trình đặt trước REDMAGIC 11 Pro – mẫu gaming phone cao cấp mới nhất của REDMAGIC, đánh dấu đợt mở bán sớm nhất tại Việt Nam.
Home Credit lọt top 10 Doanh nghiệp Bền vững lĩnh vực Thương mại - Dịch vụ
3 ngày trước
Lần thứ tư liên tiếp được VCCI vinh danh, giải thưởng này là sự khẳng định mạnh mẽ cho bước tiến vượt bậc của Home Credit Việt Nam trong chiến lược phát triển bền vững suốt 17 năm qua.
'Bé 3' VF 3 vừa giúp VinFast lập một kỷ lục 'vô đối'
3 ngày trước
Với tổng cộng 40.660 xe được bàn giao tính đến hết tháng 11 năm 2025, VinFast VF 3 đã chính thức vượt qua kỷ lục doanh năm ngoái của mẫu xe "anh em" là VF 5.