細思恐極!智能家居永遠在偷聽?
近日,電子隱私信息中心、消費者聯盟、電子民主中心等多個非營利性組織向美國聯邦貿易管理委員會上訴,多款兒童語音玩具未經同意或提示,收集語音數據。通過藍牙和用戶手機app,將語音數據轉成文字傳輸到谷歌或者Nuance的服務器上。由于法律規定未成年的隱私數據信息采集必須獲得家長的同意,并且監護人需擁有檢查和刪除信息的權利,這些看似無害的語音采集,實為極其嚴重的侵權。
銷量超過百萬的互動娃娃:My Friend Cayla
其實,隱私安全問題之所以可怕,就是因為網絡時代的信息收集無所不在。在人們開始擔心玩具在傳輸小主人的語音信息之前,段子手或者爸媽的朋友圈早就對網絡公司們收集追蹤用戶活動狀態多年的惡性諸多不滿。而當聽說那些逐漸成為家電潮流的真正的AI助手們,居然無時無刻不在監聽的時候,對人工智能的恐懼感更是與日俱增。
對于AI語音助手來說,收集人的語音、分析對話、采集數據是它們得以正常工作的基礎,但是不明真相的群眾在沒有足夠的知情權之前,聽說家里的AI助理其實可能無時無刻不在偷聽,的確有種“小音響其實是黑客帝國派來的臥底”既視感。
延伸閱讀:科技改變世界 出租房也能實現智能家居!
語音助理:你說的我都聽
Amazon Echo和Google Home是目前北美市場上最受歡迎的兩款語音助理,每當主人喊出Alexa或者google的大名,它們就會隨即記錄下人類的語音,并將這些語音文件傳輸到遠程的服務器中,通過AI“大腦”的處理,給出相應的回答。同時,人類的回答會自動儲存在個人的賬戶下面。
對應被記錄下來的語音,系統也會自動記錄AI的回答,從一次次的對比中,逐漸掌握主人的習慣、不同的口音等。對于家庭語音助手來說,個人化的專屬體驗是她希望達成的未來,通過對一個賬號的行為分析,更好地為一個家庭提供個性化的私人服務,使得記錄個人的歷史變得十分必要。
由于需要遠程傳輸處理,語音助理必須在有Wifi的環境下才能工作,同時為了防止干擾語音阻礙語音助理的學習,只有在說出喚醒詞,比如Alexa或者Google的名字時,才會處于信息傳輸被激活的狀態。
為了能夠讓語音助理準確捕捉到喚醒詞,在被喚醒前,它們依舊處于“監聽”狀態,只是此時語音助理聽到的片段,都不會被傳到處理器上記錄下來,只是時時處于備戰狀態,等待喚醒詞的激活。
其實,它的原理和一些照相機的連拍模式比較相似,相機會在完全按下快門連拍之前,先捕捉幾張畫面,以保證不會因為按下快門的手指動作遲緩而漏掉畫面。對于語音助理來說,為了保證它隨時處于不用按鍵就能夠通過語音操作的便捷性,就必須在激活前一直處在你說我聽的模式。
如果強行通過靜音鍵關掉麥克風,那么語音助理基本上就處在“罷工狀態”,只能每次要用的時候,關掉靜音鍵,再重新捕捉關鍵詞使用,很大程度上,就失去了便捷的語音啟動的意義。語音助手也會每次在開啟的時候提醒你,要打開靜音鍵才能享受完全的服務。
延伸閱讀:智能家居常見問題,這都不是事
可以刪掉的黑歷史
雖然,科技公司們的確可以追溯用戶的操作、儲存記錄,但是,對于特別在意隱私的人來說,這些賬戶大部分還是允許用戶自行刪除記錄的。
比如,如果對Alexa說了太多不可描述的黑話,用戶有可以直接在app的設置中找到這些被記錄下來的語音歷史。同樣的谷歌賬號也提供包括了谷歌搜索、YouTube視頻記錄、安卓App記錄,Google Home的語音記錄等一系列賬號歷史操作。不過雖然人肉刪除了記錄,但后臺服務器上的資料是否也會被一并刪除,就不得而知了。
每個程序都有bug,每種系統都有被黑的可能,但亞馬遜和谷歌的防護還是很到位的,從家里的語音助理到數據中心的路徑必然是加密的,即使家庭的網絡遭到破解,Amazon Echo和Google Home直接被侵入的可能性也極低。整個語音助理最容易出問題的環節,其實是賬號密碼被破解,導致操作隱私被暴露。
但是,不是每一種AI都可以刪掉黑歷史的,以Siri為例,她在將所有的對話送回云端之后,一方面,不向用戶提供查閱對話歷史的功能,同時,系統會在六個月之后,將對話與賬戶之間的關系脫鉤,只是將語音資料作為數據庫的一份子。
AI的隱私安全
蘋果在6月的WWDC上發布了Differential Privacy(差分隱私)算法,加入虛擬數據,讓人幾乎無法辨別出數據的來源和個人信息。雖然,這種算法大規模使用的可行性還未可知,但是,隱私安全的保護,的確是市場人工智能面臨的重要問題之一。
2016WWDC,蘋果軟件工程高級副總裁 Carig Federighi
顯然,并不是每一個從業者都認識到了這個問題,類似“智能”娃娃這樣沒有獲得允許,就隨意收集并出賣用戶隱私的行為,讓人懷疑這樣的娃娃,類似的AI功能和產品,是不是還存在著更多的安全漏洞。
(原標題:細思極恐:智能語音家居是永遠在偷聽的AI?)