Bí mật 'động trời' đằng sau loa thông minh và trợ lý ảo như Siri, Alexa: Nghe lén, thu thập dữ liệu người dùng, có một 'đội quân' được thuê để ghi chép lại toàn bộ những cuộc hội thoại

14/12/2019 09:08
Thị trường loa thông minh toàn cầu sẽ đạt giá trị 11 tỷ USD và khoảng 7,4 tỷ thiết bị điều khiển bằng giọng nói được sử dụng. Tuy nhiên, tất cả những thiết bị này đều thu lại mọi âm thanh, các cuộc hội thoại mà người dùng không muốn chia sẻ.

Đội nhân công giá rẻ

Ruthy Hope Slatis không thể tin vào những gì mình đang nghe thấy. Cô được một công ty agency ở ngoại ô Boston tuyển dụng, với một vị trí rất mơ hồ, đó là chuyển âm cho các tệp âm thanh từ Amazon. Được trả 12 USD/giờ, cô và các contractor (những người nhận hợp đồng), hay còn gọi là "cộng sự về dữ liệu", nghe những đoạn hội thoại ngẫu nhiên và ghi lại từng từ. Amazon chỉ cho biết công việc này rất quan trọng đối với một sản phẩm nhận dạng giọng nói đặc biệt. Từng khoảnh khắc nhỏ nhất của người sử dụng sản phẩm này đều được ghi lại.

Đó là vào mùa thu năm 2014, khi Amazon cho ra mắt loa thông minh Echo - với phần mềm trợ lý ảo Alexa được kích hoạt bằng giọng nói. Amazon quảng cáo rằng sản phẩm này như một phép màu của AI, có thể giúp các gia đình cập nhật tin tức, trả lời một số câu hỏi đơn giản và giúp trẻ làm bài tập về nhà. Tuy nhiên, Slatis nhanh chóng nhận ra con người chính là yếu tố "nắm dây cương" đằng sau những việc làm trên. Amazon nhận mọi mệnh lệnh bằng giọng nói trên đám mây và dựa vào các "cộng sự dữ liệu" như cô để "dạy" hệ thống. Mới đầu, Slatis cho rằng cô đang nghe hội thoại của nhóm người tình nguyện tham gia nghiên cứu, nhưng thực ra không phải vậy.

Những đoạn hội thoại cô và đồng nghiệp nghe đều có nội dung khá nhạy cảm và tiêu cực. Hơn nữa, khi dự án này Slatis tham gia phát triển hơn cùng với mức độ phổ biến của Alexa thì những thông tin cá nhân cũng được tiết lộ. Họ có thể nghe được những đứa trẻ nói về địa chỉ nhà và số điện thoại, hay thậm chí một người dùng hỏi Alexa rằng có phải Amazon đang nghe lén hay không. Slatis chia sẻ: "Họ không có cách nào để biết mình bị nghe lén. Và họ sẽ không đồng ý với việc này". Đến năm 2016, cô đã nghỉ việc.

Bí mật động trời đằng sau loa thông minh và trợ lý ảo như Siri, Alexa: Nghe lén, thu thập dữ liệu người dùng, có một đội quân được thuê để ghi chép lại toàn bộ những cuộc hội thoại - Ảnh 1.

5 năm kể từ khi Slatis phát hiện ra việc này, 1/4 dân số Mỹ đã sử dụng các thiết bị loa thông minh như Alexa, Goolge Home và Apple HomePod, thậm chí là Facebook's Portal được trang bị thêm 1 màn hình. Tới nay, Amazon đã giành chiến thắng ở thị trường loa thông minh, bán được hơn 100 triệu thiết bị Alexa.

Cuộc cạnh tranh giành dữ liệu người dùng của các "ông lớn"

Tuy nhiên, giữa các công ty đang xảy ra một trận chiến với làn sóng Alexa, Siri của Apple, Google Assistant của Alphabet, Cortana của Microsoft và dịch vụ tương tự của Facebook trong việc thâm nhập vào cuộc sống của người dùng. Mic được đặt vào bên trong điện thoại, smartwatch, TV, tủ lạnh, xe hơi và rất nhiều thiết bị khác. Theo ước tính của Juniper Research, thị trường loa thông minh toàn cầu sẽ đạt giá trị 11 tỷ USD và khoảng 7,4 tỷ thiết bị điều khiển bằng giọng nói được sử dụng. 

Câu hỏi đặt ra ở đây là, chuyện gì sẽ diễn ra tiếp theo? Các công ty công nghệ cho biết loa thông minh của họ chỉ thu âm khi người dùng kích hoạt chức năng đó, nhưng thực sự thì họ đang quảng cáo và cho ra mắt loại mic luôn bật ở nhà bếp hay phòng ngủ, có thể thu lại những âm thanh hay cuộc hội thoại mà người dùng không muốn chia sẻ. 

Florian Schaub, tiến sĩ nghiên cứu hành vi con người và phần mềm điều khiển bằng giọng nói tại Đại học Michigan, cho hay: "Việc các loại loa được bật mọi lúc rất đáng lo ngại. Chúng tôi phát hiện ra rằng người sử dụng thường không để tâm và liên tục sử dụng, tin tưởng các nhà sản xuất sẽ không làm điều gì xấu xa với dữ liệu được ghi lại. Họ không biết cách tự bảo vệ mình." 

Bí mật động trời đằng sau loa thông minh và trợ lý ảo như Siri, Alexa: Nghe lén, thu thập dữ liệu người dùng, có một đội quân được thuê để ghi chép lại toàn bộ những cuộc hội thoại - Ảnh 2.

Số lượng các đơn hàng loa thông minh được giao trên toàn cầu.

Tuy nhiên, loa thông minh phụ thuộc hàng ngàn lao động được trả lương thấp, họ ghi chép lại những đoạn âm thanh để các công ty công nghệ nâng cấp "đôi tai số". Những lời thì thầm với nội dung thầm kín đã trở thành một trong những dữ liệu quý giá nhất dành cho các "đại gia" công nghệ. Dù đã bị phanh phui, nhưng đối với những công ty này, đây chính là cách đơn giản và rõ ràng để họ cải thiện sản phẩm.

Năm 2012, Apple là công ty lớn đầu tiên phát triển mô hình trợ lý ảo khi ra mắt iPhone 4S với Siri, họ mua lại một phiên bản nghiên cứu từ Lầu Năm Góc. Chỉ trong vài ngày, Apple bán được hơn 4 triệu chiếc iPhone 4S và nhận được một loạt dữ liệu giọng nói miễn phí từ đó. Ở những ngày đầu, Apple chủ yếu đưa dữ liệu giọng nói cho các chuyên gia để cải thiện chức năng của Siri, nhưng lại giành quyền kiểm soát vào khoảng năm 2014. Trong vài năm qua, Apple đã phát triển mạnh mẽ hơn trong hoạt động thu thập và phân tích giọng nói người dùng, vì lo lắng rằng Siri sẽ tụt hậu so với Alexa và Google Assistant.

Năm 2019, sau khi Apple sử dụng Siri để phát triển các sản phẩm như tai nghe không dây và loa thông minh HomePod, công ty này đã xử lý tới 15 triệu lệnh bằng giọng nói mỗi tháng, tương đương khoảng hơn 360 triệu lệnh mỗi năm. Theo Mike Bastian, từng là nhà khoa học nghiên cứu chính của bộ phận Siri, rủi ro của việc vô tình ghi âm lại cũng tăng theo số lượng lệnh giọng nói mà họ xử lý. Ông chỉ ra rằng tính năng gọi Siri "raise to speak" đặc biệt nguy hiểm.

Bí mật động trời đằng sau loa thông minh và trợ lý ảo như Siri, Alexa: Nghe lén, thu thập dữ liệu người dùng, có một đội quân được thuê để ghi chép lại toàn bộ những cuộc hội thoại - Ảnh 3.

Quay trở lại với Amazon, công ty này thành lập các khu xử lý những đoạn ghi âm ở nhiều thành phố trên thế giới. Trong năm nay, họ đã tổ chức một số sự kiện tuyển dụng trực tiếp dành cho công việc này ở nước ngoài. Một chuyên gia công nghệ ngôn ngữ, người đã dành hàng thập kỷ để phát triển các hệ thống nhận dạng cho các công ty công nghệ, cho biết quy mô tuyển dụng nhân viên phân tích dữ liệu âm thanh của Amazon cực kỳ lớn. Công ty của tỷ phú Jeff Bezos thì nói họ "nghiêm túc coi trọng tính bảo mật và giọng nói của khách hàng", họ cần có sự hiểu biến đầy đủ về giọng nói của nhiều nơi, cùng tập quán để đưa Alexa hoạt động với quy mô toàn cầu.

Lời hứa hẹn sẽ không "rình mò" người dùng 

Năm nay, một số công ty công nghệ lớn đã điều chỉnh chức năng của trợ lý ảo sau khi một số thông tin về việc nghe lén được tiết lộ. Trong khi Google đã tạm dừng hoạt động phiên âm giọng nói của Assistant, Apple cũng cho phép người dùng xoá lịch sử sử dụng Siri và từ chối việc chia sẻ, do đó việc chia sẻ các bản thu âm sẽ do người dùng tuỳ chọn và trực tiếp thuê thêm nhà thầu cũ để tăng cường khả năng kiểm soát việc nghe lén. Amazon cũng đưa ra động thái tương tự.

Bí mật động trời đằng sau loa thông minh và trợ lý ảo như Siri, Alexa: Nghe lén, thu thập dữ liệu người dùng, có một đội quân được thuê để ghi chép lại toàn bộ những cuộc hội thoại - Ảnh 4.

Theo đó, có thể dễ dàng nhận thấy các chính phủ và một số tổ chức có thể lợi dụng những "mạng lưới" giám sát phổ biến này như thế nào. Hiện tại, Hạ viện Mỹ đang xem xét đưa ra những quy định để hạn chế tình trạng tự động nghe lén với sự hỗ trợ của các trợ lý ảo. Dale Sunderland, phó uỷ viên của Uỷ ban Bảo vệ Dữ liệu Ireland cho biết: "Liệu người dùng có biết rằng họ đang bị nghe lén? Nếu không thì họ cần phải biết điều đó. Chúng tôi muốn những công ty này chứng minh rằng họ đã xây dựng các biện pháp bảo vệ cần thiết như thế nào."

Theo một nghiên cứu hồi tháng 6 của Pew Research Center, ước tính hầu hết người Mỹ đều lo ngại về việc loa thông minh và các thiết bị nghe tương tự thu thập thông tin dữ liệu. Tuy nhiên, tỷ lệ chấp nhận lại đang tăng lên.

Một số nhà nghiên cứu cho biết những tiến bộ trong chức năng xử lý của smartphone và phương pháp cải tiến trí tuệ nhân tạo mới mang tên Federated Learning có thể khiến loại "loa nghe lén" ngày trở nên lỗi thời. Hơn nữa, các loại máy móc sẽ đủ thông minh để thực hiện nhiều việc mà không cần đến những contractor nữa. Đến nay, dù có thiếu đi quy định hay vấp phải sự phản đối của người tiêu dùng, thì số lượng những contractor hay thậm chí là máy móc làm công việc này sẽ tiếp tục phát triển để bắt kịp tốc độ cải tiến của các thiết bị nghe phổ biến.

Tin mới

Ma trận 16 xe giá 600-900 triệu đồng: Mitsubishi Destinator về Việt Nam 'chen chân' vào đâu?
3 giờ trước
Giá bán của Mitsubishi Destinator khi về Việt Nam đang là vấn đề được nhiều người quan tâm.
Cận cảnh iPhone 17 Pro Max với màu sắc hoàn toàn mới
2 giờ trước
Hình ảnh được cho là linh kiện cụm camera của iPhone 17 Pro và iPhone 17 Pro Max vừa rò rỉ, hé lộ 4 tùy chọn màu sắc mà Apple đang thử nghiệm cho dòng sản phẩm cao cấp sắp tới.
Hãng xe xây nhà máy 20.000 tỷ tại Việt Nam ra mắt mẫu SUV tiết kiệm xăng: chạy full nhiên liệu 1.500 km, thách thức Mazda CX-5
34 phút trước
Mẫu SUV mới có phạm vi hoạt động hoàn toàn bằng điện là 220 km và phạm vi hoạt động toàn diện là 1.500 km.
BMW X3 tăng giá hơn 300 triệu đồng nhưng vẫn rẻ hơn GLC 300, thêm cảnh báo điểm mù
13 phút trước
Giá bán BMW X3 bất ngờ tăng sau khi ra mắt thị trường chưa đầy 2 tháng.
Điện thoại gập không còn là "đồ chơi nhà giàu": Galaxy Z Fold7 và Flip7 khiến người Việt chịu chi hơn bao giờ hết, xếp hàng từ tận 7 giờ sáng để mua máy mới
44 phút trước
Ngày 26/7, dòng Galaxy Z series thế hệ mới chính thức mở bán tại Việt Nam, nhưng không đơn thuần là chuyện mở bán, sự kiện này cho thấy người dùng đã dần sẵn sàng nâng cấp sang điện thoại gập. Điều gì khiến hàng loạt khách hàng xếp hàng nhận máy sớm?

Tin cùng chuyên mục

Tỷ phú Jack Ma đạp xe dạo phố đêm, “bóc” giá xe mà choáng
19 giờ trước
Hình ảnh giản dị, gần gũi của tỷ phú Jack Ma trong một video được chia sẻ gần đây khiến nhiều người bất ngờ.
Đua nhau đổi xe máy xăng lấy xe điện, các hãng đem xe xăng đi đâu?
2 ngày trước
Nhiều người thắc mắc sau khi bên thu xe máy xăng với số lượng khá lớn, các hãng sẽ mang số xe này đi đâu?
Better Choice Awards 2024: Giải thưởng đã trao, sản phẩm giờ ra sao?
2 ngày trước
Giải xong không phải là hết: Những cái tên được vinh danh tại Better Choice Awards 2024 đang chứng minh rằng lựa chọn của người tiêu dùng, và hội đồng thẩm định, là hoàn toàn có cơ sở.
Nhộn nhịp thị trường xe điện
2 ngày trước
Những ngày qua, thị trường xe điện TPHCM dần sôi động, nhất là khi chính quyền thành phố quyết tâm hiện thực hóa mục tiêu chuyển đổi 400.000 xe máy xăng sang xe điện trong giai đoạn 2026 - 2030.