引領產業前瞻技術研發 倡議 AI 安全與可信任

如同史丹佛大學發佈最新的 2023《THE AI INDEX REPORT》 中指出,自從 2014 年之後,人工智慧重要技術進展已經由學術界主導轉移到產業界,如微軟、Google 或 Facebook 等科技公司引領風騷。鴻海研究院人工智慧研究所所長栗永徽說,身為台灣製造業龍頭,「鴻海有決心也有信心,要在 AI領域中帶領最前瞻的研究。」

他指出,2022 年鴻海研究院 AI 所主要投入兩項 AI 重要技術的研究,分別是基於自監督式學習(Self-supervised Learning)的基礎模型(Foundation Model),以及生成式 AI(Generative AI)。

深度學習(Deep Learning)教父楊立昆(Yann LeCun)稱自監督式學習的基礎模型為,「近幾年 AI 領域最令人興奮的發展」。這樣的模型對於台灣產業發展也是個好機會,可藉此全面提升高階複雜的 AI 技術與應用。那麼什麼是自監督式學習的預訓練基礎模型?

大型基礎模型 促成 AI 典範轉移

栗永徽以「學習與考試」的例子說明,比較傳統的機器學習(Machine Learning)、深度學習,自監督式學習差異。例如有位同學念書不夠多、練習題做得少,考試成績不夠理想,這像是傳統的機器學習。而大約十年前出現的深度學習,讓大家非常驚豔,因為像是針對某科目做了很多題目的同學,在某一科成績很好;但如果考別科就不行了,必須再練習很多題目才有辦法。

最近這兩年備受重視的自監督式學習,則是 AI 技術的一種創新典範轉移,所訓練出來的模型稱為基礎模型。他形容就像有一種學生,平常看很多似乎跟考試無關的東西,也沒有針對某一科特別練習,但因為基礎知識非常豐富,所以只要稍微讀一點跟考試相關的資料,就可以表現非常好

不同於傳統監督式學習一階段式的訓練,栗永徽說明,自監督式學習技術訓練分成兩個階段。首先是預訓練階段,在這個階段讓模型讀很多資料,並不針對特定任務,只是餵進各種不同的資料,就如同大家所熟知的 ChatGPT 一樣。

兩階段訓練 準確度超越大型科技公司

第二段則進入模型的微調,用少量的已標註資料來訓練模型,讓模型可以很快適用在某個特定的任務,無論是影像分類、物件偵測或者是影像分割等,都能夠在第一階段的基礎上,使用少數的資料,就產生很好的成果。

在基礎模型研發方面,鴻海研究院 AI 所在過去一年多提出多種新方法,準確度超過 Google 等大型科技公司。特別像未來應用於自駕車時,受限於車上有限的硬體資源,所以必須儘可能做到「單一模型、多任務部署」。他說,可以只使用一個基礎模型,後面接上不同的 prediction head,就可以同時做到距離估測、車道影像分割等不同的任務。

多模態基礎模型 打造新人機對話場景

這個領域目前最受矚目的發展趨勢稱為多模態基礎模型(Multi-Modality Foundation Model),顧名思義就是訓練模型時輸入的資料包括文字、語音或影像,資料愈多、基礎知識就愈多,能力也就會愈強。

有了這個模型之後,可以想像一下,當未來自駕車行駛在路上時,看到一棟特殊的建築例如 101 大樓時,可能就會主動介紹「左前方高樓是台北 101,有全世界最大的跨年倒數計時鐘。」栗永徽說,這根據當下的場景跟使用者進行資訊交流,或類似目前GPT-4已經做到的有意義對答,稱為「Context Aware Vehicle-Human Interaction 」。

生成式 AI 模擬充滿想像力的元宇宙

第二個關鍵技術生成式 AI,在 2022 年被《MIT Technology Review》評選為十大最具突破性的新科技之一。這個基於 GAN 技術生成的模型,剛開始只被使用於影像,經過幾年發展,已經可以處理文字、影像和聲音;從即時風格轉換到動態影片生成,應用範圍非常廣泛。

栗永徽表示,鴻海研究院 AI 所不僅投入資源研發更好的生成模型,也期望未來可以很快應用在更多場景。包括模擬真實街景用來訓練自駕模型、模擬製造現場、或者做很逼真的 Avatar 做為虛擬社交、互動使用,「當模擬能力愈來愈強時,就可以創造一個全新且充滿想像的元宇宙。」

快速進展同時 及早預防可能傷害

不過,隨著技術能力愈來愈強大、應用層面愈來愈廣,對於 AI 安全性的重視也必須儘速跟上。在算力、模型和數據三者並進的過程中,栗永徽說,的確看到許多新應用場景與新商機。但是,如何讓 AI 能夠發揮正面的功效,且及早避免可能對社會造成的傷害,會是下個世代 AI 領域最關鍵的議題。

例如,在各種大型基礎模型大量使用資料的狀況下,對於國家、企業與個人來說,如何治理不斷增加的資料,將是個新挑戰。他指出,目前已經可以看到的問題包括資料隱私保護、AI 安全、AI 倫理和數據偏見等;同時,還有對教育衝擊、人才培養、工作取代等許多疑慮,都是必須儘早面對並討論可能對策的問題。

鴻海研究院也從 2021 年開始倡議 AI 資通安全(AI Security),並持續推動「可信任 AI 生 態 系 」(Trusted AI Ecosystems),希望不只和產業共同致力 AI 發展,也讓世界看到台灣在 AI 生態系的重要性與影響力。

⊕本文選自鴻海研究院2022年鑑

返回頂端