Alexa diinstal pada lebih dari 100 juta perangkat di seluruh dunia, memperoleh miliaran permintaan pengguna dalam proses tersebut. Seperti semua asisten digital, Alexa mengandalkan model data untuk menawarkan respons yang lebih baik, tetapi sepertinya Amazon juga memberikan bantuan digital kepada asisten dalam bentuk ulasan manusia. Sebuah investigasi oleh Bloomberg telah mengungkapkan bahwa Amazon memiliki tim global yang mentranskrip dan menganeksasi rekaman Alexa dari seluruh dunia untuk "menghilangkan kesenjangan dalam pemahaman Alexa tentang ucapan manusia" dan memungkinkan asisten untuk memberikan respons yang lebih baik terhadap pertanyaan Anda.
Publikasi tersebut menemukan bahwa Amazon mempekerjakan ribuan orang di seluruh dunia - baik kontraktor maupun karyawan penuh waktu - untuk meninjau kembali rekaman Alexa, dengan tim-tim yang tersebar di Boston, Kosta Rika, India, dan Rumania. Menurut sumber yang tidak disebutkan namanya, masing-masing reviewer mem-parsing lebih dari 1.000 klip audio selama sembilan jam, memberi anotasi dan memberi mereka kembali ke sistem untuk meningkatkan respons Alexa. Dari Bloomberg:
Seorang pekerja di Boston mengatakan bahwa dia menambang data suara yang terakumulasi untuk ucapan-ucapan tertentu seperti "Taylor Swift" dan memberi catatan pada mereka untuk menunjukkan bahwa yang dimaksud oleh pencari adalah artis musik itu.
Kadang-kadang para pendengar mengambil barang-barang yang kemungkinan pemilik Echo lebih suka tetap pribadi: seorang wanita bernyanyi buruk di kamar mandi, mengatakan, atau seorang anak berteriak minta tolong. Tim menggunakan ruang obrolan internal untuk berbagi file ketika mereka membutuhkan bantuan untuk menguraikan kata yang kacau - atau menemukan rekaman yang lucu.
Publikasi juga menemukan bahwa karyawan menemukan rekaman yang mengganggu:
Terkadang mereka mendengar rekaman yang mereka anggap menjengkelkan, atau mungkin kriminal. Dua pekerja mengatakan mereka mengambil apa yang mereka yakini sebagai serangan seksual. Ketika sesuatu seperti itu terjadi, mereka dapat berbagi pengalaman di ruang obrolan internal sebagai cara menghilangkan stres.
Amazon mengatakan memiliki prosedur untuk diikuti pekerja ketika mereka mendengar sesuatu yang menyedihkan, tetapi dua karyawan yang berbasis di Rumania mengatakan bahwa, setelah meminta panduan untuk kasus-kasus seperti itu, mereka diberitahu bahwa bukan tugas Amazon untuk ikut campur.
Rekaman tidak memiliki nama lengkap atau alamat pengguna, tetapi mereka menyertakan nama depan pengguna, nomor akun, dan nomor seri perangkat. Amazon sebelumnya menyebutkan bahwa ia bergantung pada pemrosesan bahasa alami untuk melatih Alexa, tetapi telah mengakui kepada Bloomberg bahwa ia menggunakan elemen manusia untuk membubuhi keterangan "sampel kecil rekaman suara Alexa:"
Kami menjaga keamanan dan privasi informasi pribadi pelanggan kami dengan serius. Kami hanya memberi anotasi sampel rekaman suara Alexa yang sangat kecil untuk meningkatkan pengalaman pelanggan. Misalnya, informasi ini membantu kami melatih pengenalan ucapan dan sistem pemahaman bahasa alami kami, sehingga Alexa dapat lebih memahami permintaan Anda, dan memastikan layanan ini bekerja dengan baik untuk semua orang.
Kami memiliki pengamanan teknis dan operasional yang ketat, dan memiliki kebijakan tanpa toleransi untuk penyalahgunaan sistem kami. Karyawan tidak memiliki akses langsung ke informasi yang dapat mengidentifikasi orang atau akun sebagai bagian dari alur kerja ini. Semua informasi diperlakukan dengan kerahasiaan tinggi dan kami menggunakan otentikasi multi-faktor untuk membatasi akses, enkripsi layanan, dan audit lingkungan kontrol kami untuk melindunginya.
Bukan hanya Amazon yang beralih ke manusia sebagai pembantu untuk mengembangkan asisten digitalnya. Bloomberg menemukan bahwa Apple juga memiliki tim manusia yang memeriksa apakah interpretasi Siri tentang permintaan cocok dengan apa yang diminta oleh pengguna. Google memiliki pengulas yang melatih Asisten, tetapi klip tidak memiliki informasi pengenal pribadi dan audio itu sendiri terdistorsi untuk mencegah identifikasi.