引領產業前瞻技術研發倡議 AI 安全與可信任

如同史丹佛大學發佈最新的 2023《THE AI INDEX REPORT》中指出，自從 2014 年之後，人工智慧重要技術進展已經由學術界主導轉移到產業界，如微軟、Google 或 Facebook 等科技公司引領風騷。鴻海研究院人工智慧研究所所長栗永徽說，身為台灣製造業龍頭，「鴻海有決心也有信心，要在 AI領域中帶領最前瞻的研究。」

他指出，2022 年鴻海研究院 AI 所主要投入兩項 AI 重要技術的研究，分別是基於自監督式學習(Self-supervised Learning)的基礎模型(Foundation Model)，以及生成式 AI(Generative AI)。

深度學習(Deep Learning)教父楊立昆(Yann LeCun)稱自監督式學習的基礎模型為，「近幾年 AI 領域最令人興奮的發展」。這樣的模型對於台灣產業發展也是個好機會，可藉此全面提升高階複雜的 AI 技術與應用。那麼什麼是自監督式學習的預訓練基礎模型？

大型基礎模型促成 AI 典範轉移

栗永徽以「學習與考試」的例子說明，比較傳統的機器學習(Machine Learning)、深度學習，自監督式學習差異。例如有位同學念書不夠多、練習題做得少，考試成績不夠理想，這像是傳統的機器學習。而大約十年前出現的深度學習，讓大家非常驚豔，因為像是針對某科目做了很多題目的同學，在某一科成績很好；但如果考別科就不行了，必須再練習很多題目才有辦法。

最近這兩年備受重視的自監督式學習，則是 AI 技術的一種創新典範轉移，所訓練出來的模型稱為基礎模型。他形容就像有一種學生，平常看很多似乎跟考試無關的東西，也沒有針對某一科特別練習，但因為基礎知識非常豐富，所以只要稍微讀一點跟考試相關的資料，就可以表現非常好

不同於傳統監督式學習一階段式的訓練，栗永徽說明，自監督式學習技術訓練分成兩個階段。首先是預訓練階段，在這個階段讓模型讀很多資料，並不針對特定任務，只是餵進各種不同的資料，就如同大家所熟知的 ChatGPT 一樣。

兩階段訓練準確度超越大型科技公司

第二段則進入模型的微調，用少量的已標註資料來訓練模型，讓模型可以很快適用在某個特定的任務，無論是影像分類、物件偵測或者是影像分割等，都能夠在第一階段的基礎上，使用少數的資料，就產生很好的成果。

在基礎模型研發方面，鴻海研究院 AI 所在過去一年多提出多種新方法，準確度超過 Google 等大型科技公司。特別像未來應用於自駕車時，受限於車上有限的硬體資源，所以必須儘可能做到「單一模型、多任務部署」。他說，可以只使用一個基礎模型，後面接上不同的 prediction head，就可以同時做到距離估測、車道影像分割等不同的任務。

多模態基礎模型打造新人機對話場景

這個領域目前最受矚目的發展趨勢稱為多模態基礎模型(Multi-Modality Foundation Model)，顧名思義就是訓練模型時輸入的資料包括文字、語音或影像，資料愈多、基礎知識就愈多，能力也就會愈強。

有了這個模型之後，可以想像一下，當未來自駕車行駛在路上時，看到一棟特殊的建築例如 101 大樓時，可能就會主動介紹「左前方高樓是台北 101，有全世界最大的跨年倒數計時鐘。」栗永徽說，這根據當下的場景跟使用者進行資訊交流，或類似目前GPT-4已經做到的有意義對答，稱為「Context Aware Vehicle-Human Interaction 」。

生成式 AI 模擬充滿想像力的元宇宙

第二個關鍵技術生成式 AI，在 2022 年被《MIT Technology Review》評選為十大最具突破性的新科技之一。這個基於 GAN 技術生成的模型，剛開始只被使用於影像，經過幾年發展，已經可以處理文字、影像和聲音；從即時風格轉換到動態影片生成，應用範圍非常廣泛。

栗永徽表示，鴻海研究院 AI 所不僅投入資源研發更好的生成模型，也期望未來可以很快應用在更多場景。包括模擬真實街景用來訓練自駕模型、模擬製造現場、或者做很逼真的 Avatar 做為虛擬社交、互動使用，「當模擬能力愈來愈強時，就可以創造一個全新且充滿想像的元宇宙。」

快速進展同時及早預防可能傷害

不過，隨著技術能力愈來愈強大、應用層面愈來愈廣，對於 AI 安全性的重視也必須儘速跟上。在算力、模型和數據三者並進的過程中，栗永徽說，的確看到許多新應用場景與新商機。但是，如何讓 AI 能夠發揮正面的功效，且及早避免可能對社會造成的傷害，會是下個世代 AI 領域最關鍵的議題。

例如，在各種大型基礎模型大量使用資料的狀況下，對於國家、企業與個人來說，如何治理不斷增加的資料，將是個新挑戰。他指出，目前已經可以看到的問題包括資料隱私保護、AI 安全、AI 倫理和數據偏見等；同時，還有對教育衝擊、人才培養、工作取代等許多疑慮，都是必須儘早面對並討論可能對策的問題。

鴻海研究院也從 2021 年開始倡議 AI 資通安全(AI Security)，並持續推動「可信任 AI 生態系」(Trusted AI Ecosystems)，希望不只和產業共同致力 AI 發展，也讓世界看到台灣在 AI 生態系的重要性與影響力。

⊕本文選自鴻海研究院2022年鑑

引領產業前瞻技術研發倡議 AI 安全與可信任

About Us

Center

Research

Tech Blog

Event

Video