2024 年

2024-11-22

從數據到洞見:企業 AI 導入的關鍵基礎建設
產品經理 廖為紹

全球生成式 AI 採用率的迅速增長

麥肯錫分析截至 2024 年,全球企業對 AI 的採用率已經達到 72%,生成式 AI 的採用率更是呈現倍數成長。這項技術之所以能夠快速普及,主要在於它在多個領域中展現出實質的價值創造潛力。生成式 AI 不僅能夠自動化內容創作、強化客戶服務、優化產品設計等,更為企業帶來前所未有的創新契機。根據最新的報告指出,生成式 AI 除了提升業務效率之外,還在市場上創造了新的競爭優勢。

資料來源:McKinsey

台灣科技產業的 AI 創新應用

在生成式 AI 的應用方面,台灣已經有了相當亮眼的成果。以台積電的 tGenie 系統來說,就是一個非常成功的案例。這套內部專用的生成式 AI 系統是基於輝達晶片組所開發的,目前在台積電的後勤管理上發揮了極大功效。從 2023 年 5 月上線至今,tGenie 已經替公司省下將近一億元的外包翻譯費用。展望未來,台積電還打算把 AI 技術進一步導入生產流程當中,透過全球製造與管理平台進行同步學習和轉移,藉此提升各個廠區對製程的即時監控和效率。

聯發科的 MediaTek DaVinci 系統則是另一個展現生成式 AI 強大潛力的範例。這個具備高整合度和高擴充性的開放式平台,讓客戶可以自由挑選並客製化所需的模型。目前這個平台已經吸引了超過 20 家高科技廠商、10 家消費品牌,以及 6 家金融業者加入生態系統。除此之外,聯發科推出的繁體中文大型語言模型 MediaTek Research BreeXe,以 450 億個參數的規模超越了 GPT-3.5,特別針對台灣市場做了優化,大幅提升了生成式 AI 的使用體驗。

這些案例充分展現了生成式 AI 在提升企業競爭力方面的巨大潛力,同時也替其他企業提供了寶貴的參考經驗。台積電和聯發科這些創新應用,不僅帶動了自身的效率提升,更帶領台灣其他企業在生成式 AI 應用方面往前邁進。

AI 的資料分析技術與基礎建設

上述的例子都著重在提升生產力和節省時間方面。不過,企業和政府機關在導入 AI 時,其實還有更高的目標,譬如說針對銷售數據或風險管理進行分析。若是企業想要運用 AI 來協助分析信件內容,以獲得更深入的商業洞見,那麼嵌入(embedding)技術就扮演了關鍵的角色。嵌入技術能將文字轉換成數字向量,擷取其中的語意資訊,這對後續的機器學習模型訓練和分析來說相當重要。

舉例來說,企業可以運用 BERT 或是 Word2Vec 等模型來產生信件內容的嵌入表示,如此一來就能更精準地執行情感分析、主題辨識或自動分類等任務。

不過,執行這類分析通常需要強大的運算能力。假如企業內部缺乏足夠的運算資源,就得將信件資料傳送到外部平台,例如雲端服務供應商(AWS、Google Cloud、Azure)提供的 AI 平台。這些平台除了具備強大的運算能力外,還提供多樣化的 AI 工具和服務,能有效支援企業的資料分析需求。

在這個過程中,企業必須確保資料傳輸和儲存的安全性,並且遵守相關的隱私和資料保護法規,以保障客戶和企業本身的資料安全。

AI 專案的資料處理與生命週期管理

在生成式 AI 的時代,資料處理依然是任何成功 AI 專案的根基。因此,MLOps 和 LLMOps 不僅重視模型的開發和部署,更深入強調資料管理的重要性。AI 生命週期包含了從資料蒐集、資料清洗、資料標記到模型訓練、部署和持續監控的完整流程。

在 AI 生命週期的各階段任務中,資料處理就佔了整體 80% 的時間,包含資料整合、資料辨別、資料清理、資料標註與資料增強。因此,如何有效提升資料工程的效率,便成為建立 AI 生命週期管理的關鍵所在。

資料來源:Cognilytica White Paper AI Data Engineering Lifecycle Checklist

資料清洗是一個消除雜訊和錯誤的過程,目的在確保模型訓練的資料集品質。這包含了辨識和修正遺漏值、標準化資料格式,以及移除重複資料。資料標記則是另一個重要的步驟,尤其是在需要監督式學習的情況下。準確的標記能幫助模型更好地理解資料中的模式和趨勢,這往往需要專業知識,以確保標記的準確性和一致性。

隨著模型的開發,持續的監控和調整也是不可或缺的,以因應環境變化和資料漂移的情況。此外,模型開發不僅僅是技術層面的問題,還涉及如何選擇適合的演算法和架構,以滿足特定的業務需求。這需要資料科學家和工程師之間密切合作,以確保模型的準確性和效率。AI 生命週期中的每個階段都需要細心管理,才能確保整個系統順利運作。

跨團隊合作的重要性

在 AI 專案中,跨團隊合作扮演著極為重要的角色。資料科學家、IT 專家、業務分析師和法務合規部門需要緊密配合,以確保每個環節都能順利進行。資料科學家需要 IT 團隊提供穩定的基礎建設和工具,才能有效率地處理和分析資料。

業務部門提供的見解對於確立模型的目標和指標來說非常關鍵。他們能協助找出最具價值的應用場景,並確保技術解決方案能符合公司的策略方向。另外,法務和合規部門的參與則能確保資料使用符合相關法規,避免可能的法律風險。

這種跨部門的合作模式不僅提高了專案成功的機率,更促進了企業內部的創新和知識分享。透過這樣的協作,企業能更靈活地因應市場變化,在競爭中保持領先地位。最終,這種協作模式能帶來更有效率的決策和更具創新的解決方案,推動企業的長期發展。

結論

生成式 AI 的發展正以驚人的速度重塑全球科技生態。從內容生成到專業領域的深入應用,AI 技術已經從概念逐漸轉化為實際的生產力工具。作為一家致力於技術創新的資訊服務公司,網擎資訊深刻認識到人工智慧的變革潛力。我們將持續投入研發,緊跟全球科技發展趨勢,並以專業的跨團隊合作模式,協助企業客戶順利導入人工智慧技術。未來,網擎資訊將聚焦於人工智慧生命週期管理、資料處理優化,以及安全合規的人工智慧解決方案,為台灣企業的數位轉型提供關鍵支持。我們相信,唯有保持創新、紮實做好資料治理的基本功,才能在這波人工智慧浪潮中持續成長與突破,為企業創造更多價值。

 

參考來源