當我跟別人說我在 Google 搜尋部門任職時,偶而會被問到:「還有工作需要你做嗎?」我總是不假思索地回答:「當然有!」我們仍在設法克服多不勝數的挑戰,一切都是為了讓使用者享有更優質的 Google 搜尋體驗。今天我們想要分享的內容,相信是許多人都會有同感的問題:總是要輸入各種查詢字詞並透過多次搜尋,才能找到所需的答案。
想像一下以下情境:你已經攀登過美國的亞當斯山 (Mt. Adams),明年秋天想去爬日本的富士山 (Mt. Fuji),因此你想知道在進行登山準備時,有哪些不同的地方需要特別留意。現在的 Google 可以協助你尋找這些資料,但是你必須透過許多次搜尋,才能找到所有需要的答案,包括分別查詢這兩座山的海拔高度、秋天的平均溫度、登山道的難易度、需要準備哪些適合的裝備等等。
不過,假如眼前有一位登山專家,你只需要詢問他一個問題:「我需要做哪些不同的登山準備?」就能得到鉅細靡遺的答案;對方不但會將你的任務細節都納入考量,還會逐一告訴你許多必須注意的事項。
這個登山的情境並非特例;我們每天都必須在 Google 上透過多個步驟完成各式各樣的工作。根據我們的實際調查結果,使用者在處理複雜的工作時,平均必須執行 8 次查詢。
現今的搜尋引擎還不夠精密,無法像真人專家一樣回答問題,但隨著 Multitask Unified Model (MUM) 這項新技術的問世,我們又朝這個理想邁進了一步,有朝一日將能協助使用者解決這類複雜需求。未來,使用者將透過較少的搜尋次數就能得到所有所需的解答。
在沒有簡單的答案時提供幫助
未來 MUM 有可能徹底改變 Google 如何協助使用者處理複雜工作的方式。MUM 與 BERT 一樣,都是以 Transformer 架構 為基礎,但 MUM 的效能比 BERT 強大 1,000 倍。MUM 不只會解讀語言,還可以產生語言內容; 這個模型同時接受了 75 種語言和多種工作的訓練,所以比起先前的模型,可以更廣泛地了解資訊和世界上的知識 。此外,MUM 是多重模組,可以解讀文字和圖片中的資訊,未來甚至還能擴展至影片、音訊等其他模組。
以攀爬富士山的問題為例:MUM 能夠理解你想要比較兩座山的情況,所以會將海拔及登山步道情況列為相關資訊。MUM 也知道在登山的情境下,「準備」的意思包括進行體適能訓練和尋找適當的裝備。
MUM 解讀使用者以複雜的問題進行查詢的模式
由於 MUM 可以根據對世界的深厚知識來呈現深入分析資訊,因此產生的回應會強調兩座山的海拔高度差不多,但秋天的富士山處於雨季,因此你可能需要帶一件防水外套。MUM 也會顯示可以深入探索的實用子主題 (例如評分最高的裝備或最佳訓練運動),並推薦網路上實用的文章、影片和圖片。
消弭語言障礙
在獲取資訊時,語言有時會成為巨大的阻礙。MUM 具有打破語言障礙的潛力,可以將知識傳播給使用各種語言的族群。當使用者以慣用語言輸入搜尋字詞後,MUM 可以從其他語言的來源得到資訊,然後再將這些資訊傳達給你。
假設現在網路上有一些十分有用的富士山資訊,但因為這些資訊是日文,所以如果不用日文搜尋,可能就無法找到這些情報,但 MUM 可以傳遞來自各種語言的知識,並使用這些深入分析資訊找出你慣用語言中最為相關的搜尋結果。因此,未來你在搜尋關於遊覽富士山的資訊時,可能會看到從哪裡可以欣賞到最美的富士山景,以及當地有哪些溫泉和熱門的紀念品商店;這些通常要使用日文搜尋才比較容易找到的資訊,之後對你來說都會變得觸手可及。
當使用者以慣用語言輸入搜尋字詞,MUM 可以從其他語言的來源獲取資訊,在搜尋結果中一併呈現
解讀各種類型的資訊
MUM 是多重模組;換句話說,這個模型可以同時解讀多種不同格式的資訊,包括網頁、圖片等內容。未來你也許只要拍下自己登山靴的相片,並查詢「我可以穿這雙靴子去爬富士山嗎?」MUM 就會解讀圖片,將分析結果與你的問題相互連結,然後告訴你這雙靴子很適合攀爬富士山,或許還會將你導向特定網誌,方便你瀏覽推薦裝備清單。
MUM 多重模組特性,可以解讀網頁、圖片等不同格式的資訊
以負責的態度將進階 AI 技術應用於搜尋功能
每當我們在 AI 技術開發上取得飛躍式的進展,讓使用者更容易存取世界各地的資訊之時,我們總是抱持著兢兢業業的態度。Google 搜尋功能的每項改善項目都經過謹慎評估,以確保能提供使用者更為相關而實用的結果。人工評估團隊會根據 Google 搜尋品質評分者指南 ,幫助我們瞭解搜尋結果協助使用者找到所需資訊的成效如何。
我們在 2019 年推出 BERT 時,對眾多 BERT 應用案例進行了嚴謹的測試;同樣地,未來幾個月或幾年,我們將 MUM 模型應用在搜尋功能中時,也會對 MUM 執行這套測試程序。具體而言,我們會仔細尋找機器學習中可能產生偏誤的模式,避免將偏誤導入系統中。 我們也會善用最新的 研究 結果,也就是如何減少像 MUM 這類訓練系統的碳足跡,來確保搜尋服務盡可能維持高執行效率。
在接下來幾個月和幾年內,我們會逐漸對各項產品推出採用 MUM 技術的功能及改善項目。雖然我們對 MUM 的探索還在初期階段,然而對於未來,Google 能夠瞭解人類所有不同的自然溝通方式進而解讀資訊,這可是一個別具意義的里程碑。
本文作者:Google 搜尋研究員暨副總裁 Pandu Nayak
作者已經移除這則留言。
回覆刪除The former president ALL-BET held his first campaign rally ลิงค์รับทรัพย์ since Biden dropped ปั่นสล็อต out in North Carolina on Wednesday เครดิตฟรี attacking Harris as a “radical liberal” 123VEGA who voters will reject in บาคาร่าออนไลน์ November. After Biden delivered สล็อตออนไลน์ his Oval Office speech หวยออนไลน์ Trump said on social media สูตรสล็อต that is was “barely understandable เกมสล็อต and sooo bad.”
回覆刪除