Vì sao người Việt cần làm phần mềm dịch thuật trong khi Google Translate là một công cụ tốt?

06/08/2018 16:46
Google Translate “thông minh hơn” dựa vào sự đóng góp của cộng đồng. Tuy nhiên, đã có một số cá nhân đóng góp bản dịch sai để phá hoại cơ sở dữ liệu và khiến Google Translate trả kết quả không đúng. Vì vậy, cần có phần mềm dịch thuật do người Việt phát triển và được các chuyên gia đóng góp bản dịch.

Sáng ngày 06/8/2018, Viện nghiên cứu Châu Phi và Trung Đông cùng với Hội Trí thức Khoa học và Công nghệ trẻ Việt Nam đã tổ chức Tọa đàm khoa học "Công nghệ trong hỗ trợ dịch thuật và nghiên cứu khoa học". PGS.TS Lê Phước Minh, Viện trưởng Viện nghiên cứu Châu Phi và Trung Đông kiêm Phó Chủ tịch Phụ trách Hội Trí thức Khoa học và Công nghệ Trẻ Việt Nam đã tham dự tọa đàm.

Cần có công cụ dịch thuật do trong nước sáng tạo

Ông Lê Phước Minh cho biết, dịch thuật đang là vấn đề được những người làm khoa học quan tâm. Nhiều thuật ngữ mất rất nhiều thời gian để có thể chuyển ngữ sang tiếng Việt nhưng không được số hóa. Điều này khiến việc tiếp cận đến các bản dịch của các nhà khoa học trước đây gặp khó khăn. Trong trường hợp không tìm được bản dịch, những người làm khoa học sau này phải nghiên cứu và dịch lại các thuật ngữ mà thế hệ trước đã từng dịch. Không chỉ tốn thời gian, bản dịch mới nhiều khi không tốt như các bản dịch trước đây.

"Nhiều chuyên gia từng dịch được nhiều tác phẩm hay. Nhưng khi chuyên gia về hưu thì tri thức của họ cũng về hưu theo. Cần làm cách nào đó để tri thức ấy phải ở lại viện nghiên cứu. Sau đó phải sẻ dữ liệu để các thế hệ sau không dịch thuật lại những câu chữ mà người trước đã làm" – ông Lê Phước Minh nói.

Thực tế, 80% thời gian dịch thuật thường chỉ dịch lại những câu đươn giản và không cần tới người giỏi chuyên môn. Theo PGS. TS Nguyễn Ái Việt, Viện trưởng Viện Công nghệ thông tin (Đại học Quốc gia Hà Nội), để tăng tốc độ dịch thuật, các đơn vị thường chia nhỏ tác phẩm để nhiều người cùng tham gia dịch. Điều này khiến cho văn phong văn bản sau khi dịch không thống nhất.

Bên cạnh đó, dịch thuật không chỉ đơn giản là chuyển ngữ mà còn phải bảo đảm người đọc văn bản dịch hiểu được ý nghĩa của các tác phẩm. Muốn dịch được thành ngữ, người dịch phải tìm đọc điển tích, điển cố sau đó mới dịch và chau chốt lại câu văn. Việc này càng tốn nhiều thời gian hơn.

"Sẽ có người nhắc đến Google và cho rằng máy dịch không tốt. Thực ra Google dịch như vậy là tốt và sẽ càng tốt hơn mỗi ngày với sự đóng góp của cộng đồng. Nhưng Google sẽ mãi mãi không dịch tốt bằng con người. Trong 10 năm qua, tôi đã nghiên cứu và phát triển phần mềm dịch. Các bản dịch trong phần mềm này được đóng góp bởi các chuyên gia. Do đó, trong các chuyên ngành, độ chính xác cao hơn Google tới 50%" – ông Nguyễn Ái Việt nói.

PGS. TS Nguyễn Ái Việt cho biết, 5 chuyên ngành mà phần mềm BOCOHAN dịch tốt hơn Google bao gồm: y dược, công nghệ thông tin, tài chính, luật, thông tin đối ngoại. Dự trên mức độ cấp thiết mà ông và các công sự đã xây dựng cơ sở dữ liệu trước. "Khi chuẩn bị đăng ký với Bộ Công thương, Bộ Ngoại giao đã bày tỏ sự quan tâm với phần mềm và muốn có mảng thông tin đối ngoại. Sau này, Cục Thông tin đối ngoại thuộc Bộ Thông tin và Truyền thông được thành lập cũng muốn dịch chính xác các tài liệu về Hoàng Sa và Trường Sa" - PGS. TS Nguyễn Ái Việt kể lại.

Có thể ứng dụng thêm các công nghệ 4.0 để tạo hệ tri thức Việt số hóa

PGS.TS Huỳnh Quyết Thắng, Phó Hiệu trưởng Trường Đại học Bách khoa Hà Nội đánh giá phần mềm dịch thuật có tiềm năng ứng dụng rất cao trong đời sống, đặc biệt khi ứng dụng thêm các công nghệ 4.0.

"Nếu chúng ta có một kho tri thức như vậy và do các chuyên gia đóng góp thì sinh viên tham khảo nhanh hơn, tìm hiểu được các bài viết bằng tiếng Việt và ngôn ngữ gốc nhanh hơn. Ngược lại, chính sinh viên cũng đóng góp thuật ngữ mới trong quá trình tìm hiểu. như vậy, tri thức chia sẻ rất nhanh. Để làm được điều đó, phải tóm tắt được văn bản, tìm kiếm văn bản liên quan,… Lúc này, sử dụng công nghệ mới như big data, AI (trí tuệ nhân tạo) là phù hợp" – ông Huỳnh Quyết Thắng nói.

Theo ông Huỳnh Quyết Thắng, ở cấp độ cao hơn, phần mềm dịch thuật có thể giúp các nhà khoa học trong việc đọc nhanh tài liệu, xây dựng hệ tri thức Việt số hóa.

"Wikipedia là một cây tri thức khổng lồ, có tất cả các thuật ngữ trên thế giới được định danh đầy đủ. Trong lĩnh vực công nghệ thông tin, chúng ta có thể đóng góp tri thức để ra những thuật ngữ tương ứng. Chỉ cần câu trúc theo hình cây thì có thể đóng góp được cho Wikipedia. Các thuật ngữ rời rạc nhưng có liên quan đến nhau hoàn toàn có thể được hệ thống liên kết vào nối với nhau" – ông Huỳnh Quyết Thắng giải thích.

Tin mới

Mỹ bất ngờ dỡ lệnh trừng phạt dự án khí đốt ‘khủng’ của Nga, nước đồng minh Washington ‘thở phào’
32 phút trước
Động thái của Mỹ mang lại lợi ích tạm thời cho Nhật Bản.
Tiến sĩ Nguyễn Thị Phương Thảo vào danh sách "Các nhân vật ảnh hưởng năm 2025"
43 phút trước
TS Nguyễn Thị Phương Thảo, Chủ tịch HĐQT Vietjet vừa được Tatler vinh danh trong danh sách 'Các Nhân vật ảnh hưởng năm 2025' - bảng xếp hạng uy tín quy tụ những cá nhân có tầm ảnh hưởng nổi bật, đóng vai trò kiến tạo xu hướng và lan tỏa giá trị tích cực tại châu Á.
Châu Âu bất ngờ quay xe hủy lệnh cấm xe xăng dầu từ năm 2035: Ford, Volkswagen 'ăn mừng' nhưng chuyên gia cảnh báo chỉ là 'chiến thắng trong bi kịch'
45 phút trước
Ủy ban châu Âu (EU) đã bật đèn xanh cho kế hoạch hủy bỏ lệnh cấm xe xăng dầu, tập trung xe điện từ sau năm 2035, thay vào đó đặt mục tiêu giảm 90% lượng phát thải CO₂.
Gần 19 triệu lượt khách đi metro số 1 TP.HCM, vượt xa kỳ vọng
47 phút trước
Trước khi đưa vào khai thác thương mại, tuyến metro số 1 TP.HCM (Bến Thành - Suối Tiên) dự báo phục vụ khoảng 39.000 lượt hành khách/ngày. Song, thực tế người dân di chuyển hàng ngày đông hơn nhiều.
Thị trường tiền số hôm nay, 17-12: Bitcoin xuất hiện tín hiệu khác thường
49 phút trước
Trong vài ngày gần đây, lượng Bitcoin được các tổ chức mua vào đã vượt số lượng Bitcoin mới được tạo ra mỗi ngày.

Tin cùng chuyên mục

Hyundai Accent facelift lộ ảnh nội thất: Vô lăng mới, màn hình 12,3 inch, điều hoà 2 vùng, tăng sức đấu Toyota Vios
5 giờ trước
Bản nâng cấp giữa vòng đời của Hyundai Accent cho thấy hãng xe Hàn Quốc tập trung nhiều hơn vào công nghệ và tiện nghi, trong khi kết cấu và nền tảng vận hành cơ bản vẫn được giữ nguyên.
Sau ô tô điện, TMT Motors tiếp tục đặt cược lớn vào xe máy điện
6 giờ trước
CTCP Ô tô TMT (TMT Motors, HOSE: TMT) lên kế hoạch bán 20,000 xe máy điện trong năm 2026, mang về khoảng 294 tỷ đồng doanh thu.
Phát minh của Trung Quốc làm rung chuyển ngành xây dựng và cứu hộ: máy xúc 'biến hình' thành tàu thủy, hoạt động liên tục 12 giờ giữa vùng lũ lụt
7 giờ trước
Thiết bị mới được kỳ vọng sẽ thay đổi cách tiếp cận trong công tác cứu nạn, kiểm soát lũ và thi công ở những khu vực mà máy móc truyền thống gần như “bó tay”.
Coteccons: Quản trị hiệu quả định hình lợi thế cạnh tranh mới cho doanh nghiệp xây dựng
1 ngày trước
Ngành xây dựng đang bước vào giai đoạn tái định hình mạnh mẽ trong cam kết chung của Việt Nam giảm 15,8% tương đương 146,3 triệu tấn CO2 vào năm 2030. Theo đó, yêu cầu giảm phát thải, minh bạch vận hành và quản trị rủi ro đang trở thành “giấy thông hành” cho doanh nghiệp trong bối cảnh tiêu chuẩn ESG ngày càng được áp dụng rộng rãi bởi