Nhật Bản nhắm mục tiêu sở hữu mô hình AI 'Made in Japan', vận hành hoàn toàn bằng dữ liệu trong nước

8 giờ trước
Chính quyền Tokyo muốn hỗ trợ việc phát triển mô hình nội địa “sử dụng dữ liệu Nhật Bản” nhằm tránh phụ thuộc vào các mô hình từ Mỹ hoặc Trung Quốc.
Nhật Bản nhắm mục tiêu sở hữu mô hình AI 'Made in Japan', vận hành hoàn toàn bằng dữ liệu trong nước - Ảnh 1

Khi các mô hình ngôn ngữ lớn (LLM) như OpenAI GPT hay các phiên bản của Google DeepMind được phát hành rộng rãi, thị trường Nhật Bản – với ngôn ngữ, văn hoá và bối cảnh riêng – bắt đầu nhận ra một điều: muốn tạo ra AI hiệu quả và phù hợp, chỉ “nhập khẩu” mô hình ngoại quốc thôi thì chưa đủ. Thay vào đó, việc thu thập và huấn luyện với dữ liệu bản địa mới chính là con đường khả thi trong ngôn ngữ riêng.

Một trong những cái tên nổi bật trong cuộc đua này là SoftBank Corp. (SB), thông qua công ty con SB Intuitions Corp., đang đẩy mạnh phát triển các mô hình tiếng Nhật chuyên biệt — sử dụng cơ sở hạ tầng AI “khổng lồ” và dữ liệu huấn luyện nội địa. Ví dụ, họ công bố vừa riển khai hệ thống tính toán với hơn 10.000 GPU và sức mạnh tới 13,7 exa-flops trên nền tảng DGX SuperPOD của NVIDIA Corporation  và sẽ sử dụng tài nguyên đó để huấn luyện mô hình “Sarashina” chuyên tiếng Nhật.

Thế mạnh nằm ở “điểm yếu” mà nhiều mô hình quốc tế đối mặt: tiếng Nhật vốn có cấu trúc, cách diễn đạt, văn hoá và ngữ cảnh rất khác tiếng Anh. Các mô hình LLM phát triển chủ yếu cho tiếng Anh thường gặp khó trong việc xử lý tiếng Nhật một cách “mượt” hoặc chính xác về ngữ nghĩa, ngôn ngữ giao tiếp và bối cảnh văn hoá. Vì vậy, các nhà phát triển ở Nhật nhận ra rằng nếu lấy dữ liệu tiếng Nhật chất lượng cao — như hội thoại nội địa, văn bản quảng cáo, sáng tác tiếng Nhật, hội thoại thực tế, vị thế cạnh tranh hoàn toàn có thể được cải thiện.

Trong bối cảnh này, Chính phủ Nhật đóng vai trò xúc tác quan trọng. Theo báo cáo, chính quyền Tokyo muốn hỗ trợ việc phát triển mô hình nội địa “sử dụng dữ liệu Nhật Bản” nhằm tránh phụ thuộc vào các mô hình từ Mỹ hoặc Trung Quốc — lý do không chỉ là kỹ thuật mà còn liên quan tới chủ quyền dữ liệu, bảo mật thông tin và đảm bảo mô hình trả lời đúng theo bối cảnh văn hoá/văn bản Nhật.

Những nỗ lực thực tế đã bắt đầu mang dấu ấn cụ thể: công ty quảng cáo Dentsu Inc., cùng với Dentsu Digital và SoftBank, công bố dự án nghiên cứu chung để tạo ra LLM chuyên về sáng tạo nội dung quảng cáo tiếng Nhật — dự án sử dụng dữ liệu từ các copywriter nội địa phối hợp với mô hình “Sarashina”.

Nhật Bản nhắm mục tiêu sở hữu mô hình AI 'Made in Japan', vận hành hoàn toàn bằng dữ liệu trong nước - Ảnh 2

Tuy vậy, hành trình này không hề dễ dàng. Thách thức đầu tiên nằm ở chi phí: việc thu thập, gắn nhãn và xử lý hàng nghìn giờ hội thoại đòi hỏi một hạ tầng khổng lồ và đội ngũ chuyên gia ngôn ngữ học công nghệ cao. Hơn nữa, Nhật Bản phải đối mặt với tình trạng thiếu nhân lực AI – vấn đề mà chính Thủ tướng từng cảnh báo sẽ trở thành điểm nghẽn lớn nếu không được giải quyết.

Bên cạnh đó, quy mô vẫn là một rào cản. Các mô hình như GPT-4 của OpenAI hay Gemini của Google được huấn luyện trên hàng nghìn tỷ tham số. Việc bắt kịp quy mô đó gần như bất khả thi với nguồn lực hạn chế của Nhật Bản. Vì thế, các công ty trong nước phải chọn hướng đi tối ưu: tập trung vào ngữ cảnh tiếng Nhật, tạo ra mô hình “vừa đủ lớn để hữu dụng, vừa đủ nhỏ để hiệu quả”.

Thế nhưng, chính sự khác biệt đó lại có thể là chìa khóa. Trong bối cảnh thế giới ngày càng lo ngại về quyền riêng tư và chủ quyền dữ liệu, việc sở hữu mô hình AI “Made in Japan”, vận hành hoàn toàn bằng dữ liệu trong nước, giúp Tokyo có lợi thế cả về pháp lý lẫn đạo đức. Nó đảm bảo rằng các hệ thống AI trong nước – từ trợ lý ảo chính phủ, chatbot y tế đến dịch vụ tài chính – đều tuân thủ chuẩn mực văn hóa và luật pháp Nhật.

Các chuyên gia nhận định, nếu SoftBank thành công, Nhật Bản có thể trở thành một trung tâm AI khu vực châu Á – không phải bằng việc cạnh tranh về quy mô, mà bằng việc định hình xu hướng “AI bản địa hóa”, nơi mỗi quốc gia tự phát triển mô hình riêng phản ánh ngôn ngữ và văn hóa của mình. “AI không thể chỉ nói ngôn ngữ của Silicon Valley. Nó phải nói ngôn ngữ của người dân nơi nó phục vụ,” một kỹ sư của SB Intuitions chia sẻ trên Nikkei.

Theo: Nikkei Asia

Tin mới

'Vũ khí' mới của Trung Quốc đối đầu đòn thuế của Tổng thống Trump
11 giờ trước
Giữa căng thẳng thương mại với Mỹ, Trung Quốc vẫn duy trì tăng trưởng, dù kinh tế trong nước chững lại và tiêu dùng có phần giảm sút.
Cấp chứng nhận bảo trì chuyên sâu cho ba dòng máy bay thương gia tại Việt Nam
10 giờ trước
Cục Hàng không Việt Nam đã cấp chứng nhận cho công ty Dịch vụ Hàng không ExecuJet Haite Aviation Services được phép thực hiện bảo trì thường kỳ và bảo trì chuyên sâu đối với các máy bay thương gia mang đăng ký tại Việt Nam thuộc các hãng Dassault, Embraer và Gulfstream.
Sau Qatar, tới lượt nước xuất khẩu LNG lớn nhất thế giới dọa ngừng cung cấp khí đốt cho EU, châu Âu lập tức hành động
10 giờ trước
Đạo luật bền vững doanh nghiệp của Liên minh châu Âu gây chia rẽ trong khối khi chính sách này được cho là gây rủi ro đối với nguồn cung năng lượng.
Đề xuất bỏ quy định người dân lắp điện mặt trời mái nhà phải báo với EVN
10 giờ trước
Bộ Công Thương đề xuất trong trường hợp điện mái nhà của người dân có đấu nối với hệ thống điện quốc gia (kể cả chỉ tự tiêu, không bán điện dư) sẽ phải gửi thông báo qua UBND cấp xã, thay vì thông báo tới điện lực như trước.
Đại diện UBCKNN: Nhiều quỹ nghìn tỷ USD đang rất quan tâm đến chứng khoán Việt Nam sau nâng hạng
10 giờ trước
Sau khi có kết quả công bố nâng hạng, có rất nhiều nhà đầu tư là các quỹ thụ động lẫn chủ động trước đây chưa từng quan tâm đến Việt Nam thì hiện tại đã đến tìm hiểu rất nhiều.

Bảng giá cập nhật trực tuyến

Cao su

RUBBER

37.815.552 VNĐ / tấn

172.80 JPY / kg

0.29 %

+ 0.50

Đường

SUGAR

8.891.493 VNĐ / tấn

15.31 UScents / lb

1.19 %

+ 0.18

Cacao

COCOA

165.144.267 VNĐ / tấn

6,269.00 USD / mt

0.90 %

- 57.00

Cà phê Arabica

COFFEE ARABICA

246.005.711 VNĐ / tấn

423.59 UScents / lb

0.02 %

- 0.09

Gạo

RICE

12.298 VNĐ / tấn

10.26 USD / CWT

2.01 %

- 0.21

Đậu nành

SOYBEANS

10.048.178 VNĐ / tấn

1,038.10 UScents / bu

0.32 %

+ 3.30

Bột đậu nành

SOYBEAN MEAL

8.425.430 VNĐ / tấn

290.15 USD / ust

0.05 %

+ 0.15

» Xem tất cả giá Nông sản

Tin cùng chuyên mục

Nhân viên Apple 'khổ sở' vì tên là Samsung, phải đổi họ để được yên ổn
10 giờ trước
Một cái tên nghe như trò đùa định mệnh, khi người tên Samsung lại làm việc cho đối thủ của Samsung.
'Chương sử mới' trong đàm phán Thái Lan - Campuchia: Đề xuất xây tường biên giới 8,4 km gây chú ý
9 giờ trước
Phiên họp đặc biệt kéo dài hai ngày của Ủy ban Biên giới hỗn hợp (JBC) giữa Thái Lan và Campuchia đã kết thúc thành công.
Chỉ cần 2 năm, láng giềng Việt Nam đã phá vỡ thế độc quyền của Nhật Bản và Đức: Ai nói họ là "vua copy"?
9 giờ trước
Sự phát triển của quốc gia này đạt ngưỡng không tưởng.
Choáng với tốc độ tăng của nợ công Mỹ
3 giờ trước
Giữa lúc chính phủ đóng cửa, nợ công Mỹ đã vượt mốc 38 ngàn tỉ USD hôm 22-10 sau khi đạt mức 37 ngàn tỉ USD hồi tháng 8.