當我跟別人說我在 Google 搜尋部門任職時,偶而會被問到:「還有工作需要你做嗎?」我總是不假思索地回答:「當然有!」我們仍在設法克服多不勝數的挑戰,一切都是為了讓使用者享有更優質的 Google 搜尋體驗。今天我們想要分享的內容,相信是許多人都會有同感的問題:總是要輸入各種查詢字詞並透過多次搜尋,才能找到所需的答案。
想像一下以下情境:你已經攀登過美國的亞當斯山 (Mt. Adams),明年秋天想去爬日本的富士山 (Mt. Fuji),因此你想知道在進行登山準備時,有哪些不同的地方需要特別留意。現在的 Google 可以協助你尋找這些資料,但是你必須透過許多次搜尋,才能找到所有需要的答案,包括分別查詢這兩座山的海拔高度、秋天的平均溫度、登山道的難易度、需要準備哪些適合的裝備等等。
不過,假如眼前有一位登山專家,你只需要詢問他一個問題:「我需要做哪些不同的登山準備?」就能得到鉅細靡遺的答案;對方不但會將你的任務細節都納入考量,還會逐一告訴你許多必須注意的事項。
這個登山的情境並非特例;我們每天都必須在 Google 上透過多個步驟完成各式各樣的工作。根據我們的實際調查結果,使用者在處理複雜的工作時,平均必須執行 8 次查詢。
現今的搜尋引擎還不夠精密,無法像真人專家一樣回答問題,但隨著 Multitask Unified Model (MUM) 這項新技術的問世,我們又朝這個理想邁進了一步,有朝一日將能協助使用者解決這類複雜需求。未來,使用者將透過較少的搜尋次數就能得到所有所需的解答。
在沒有簡單的答案時提供幫助
未來 MUM 有可能徹底改變 Google 如何協助使用者處理複雜工作的方式。MUM 與 BERT 一樣,都是以 Transformer 架構為基礎,但 MUM 的效能比 BERT 強大 1,000 倍。MUM 不只會解讀語言,還可以產生語言內容;這個模型同時接受了 75 種語言和多種工作的訓練,所以比起先前的模型,可以更廣泛地了解資訊和世界上的知識。此外,MUM 是多重模組,可以解讀文字和圖片中的資訊,未來甚至還能擴展至影片、音訊等其他模組。
以攀爬富士山的問題為例:MUM 能夠理解你想要比較兩座山的情況,所以會將海拔及登山步道情況列為相關資訊。MUM 也知道在登山的情境下,「準備」的意思包括進行體適能訓練和尋找適當的裝備。
MUM 解讀使用者以複雜的問題進行查詢的模式
由於 MUM 可以根據對世界的深厚知識來呈現深入分析資訊,因此產生的回應會強調兩座山的海拔高度差不多,但秋天的富士山處於雨季,因此你可能需要帶一件防水外套。MUM 也會顯示可以深入探索的實用子主題 (例如評分最高的裝備或最佳訓練運動),並推薦網路上實用的文章、影片和圖片。
消弭語言障礙
在獲取資訊時,語言有時會成為巨大的阻礙。MUM 具有打破語言障礙的潛力,可以將知識傳播給使用各種語言的族群。當使用者以慣用語言輸入搜尋字詞後,MUM 可以從其他語言的來源得到資訊,然後再將這些資訊傳達給你。
假設現在網路上有一些十分有用的富士山資訊,但因為這些資訊是日文,所以如果不用日文搜尋,可能就無法找到這些情報,但 MUM 可以傳遞來自各種語言的知識,並使用這些深入分析資訊找出你慣用語言中最為相關的搜尋結果。因此,未來你在搜尋關於遊覽富士山的資訊時,可能會看到從哪裡可以欣賞到最美的富士山景,以及當地有哪些溫泉和熱門的紀念品商店;這些通常要使用日文搜尋才比較容易找到的資訊,之後對你來說都會變得觸手可及。
當使用者以慣用語言輸入搜尋字詞,MUM 可以從其他語言的來源獲取資訊,在搜尋結果中一併呈現
解讀各種類型的資訊
MUM 是多重模組;換句話說,這個模型可以同時解讀多種不同格式的資訊,包括網頁、圖片等內容。未來你也許只要拍下自己登山靴的相片,並查詢「我可以穿這雙靴子去爬富士山嗎?」MUM 就會解讀圖片,將分析結果與你的問題相互連結,然後告訴你這雙靴子很適合攀爬富士山,或許還會將你導向特定網誌,方便你瀏覽推薦裝備清單。
MUM 多重模組特性,可以解讀網頁、圖片等不同格式的資訊
以負責的態度將進階 AI 技術應用於搜尋功能
每當我們在 AI 技術開發上取得飛躍式的進展,讓使用者更容易存取世界各地的資訊之時,我們總是抱持著兢兢業業的態度。Google 搜尋功能的每項改善項目都經過謹慎評估,以確保能提供使用者更為相關而實用的結果。人工評估團隊會根據 Google 搜尋品質評分者指南,幫助我們瞭解搜尋結果協助使用者找到所需資訊的成效如何。
我們在 2019 年推出 BERT 時,對眾多 BERT 應用案例進行了嚴謹的測試;同樣地,未來幾個月或幾年,我們將 MUM 模型應用在搜尋功能中時,也會對 MUM 執行這套測試程序。具體而言,我們會仔細尋找機器學習中可能產生偏誤的模式,避免將偏誤導入系統中。我們也會善用最新的研究結果,也就是如何減少像 MUM 這類訓練系統的碳足跡,來確保搜尋服務盡可能維持高執行效率。
在接下來幾個月和幾年內,我們會逐漸對各項產品推出採用 MUM 技術的功能及改善項目。雖然我們對 MUM 的探索還在初期階段,然而對於未來,Google 能夠瞭解人類所有不同的自然溝通方式進而解讀資訊,這可是一個別具意義的里程碑。
本文作者:Google 搜尋研究員暨副總裁 Pandu Nayak
作者已經移除這則留言。
作者已經移除這則留言。
回覆刪除