城大科研團隊開發生成式人工智能(GenAI)技術,建立「科創 GPT」,通過創建科研知識圖譜,勾勒出科研項目、論文、專利等之間的關係,以助成立不同領域的知識庫,促進知識共享。項目 獲政府「產學研 1+計劃」撥款資助。
為解決「資訊孤島」(information silos)的問題,自2007年起,城大資訊系統學系教授馬建及團隊致力開發並不斷改良「科研之友」(ScholarMate.com)平台,使它成為中國最專業的協同創新網絡平台,成功連繫政府資助機構、大學、科研機構及科創公司,促進合作與知識共享,實現科研成果(如學術論文與專利)共用。科研之友迄今有超過800萬名註冊用戶,收錄達7800萬項研究成果。
以此為基礎,馬建的團隊現正開發新一代的「聯邦學習技術」(Federated Learning Technology),結合了科研知識圖譜(knowledge graphs) 與大型語言模型(Large Language models),同時以去中心化模式,促進創新網絡平台上的用戶,共同訓練及微調上述圖譜及模型,著力推動及實現科技創新服務的數碼化轉型,從而釋放生成式人工智能的力量。項目近日獲得了香港特區政府創新科技署推出的「產學研 1+計劃」資助。
項目旨在創建一個具有生成式人工智能能力的智慧協同創新網絡平台,保障數據安全、私隱,並具有運營效率。新平台將專注於創立及構建內容全面的科研知識圖 譜,即以圖譜方式,勾勒出全球各間大學、研究機構和科技公司內部的研究人員、 科研項目、研究論文和專利等之間的關係。按照國家研究學科的標準和相關新興產 業來組織數據,目標是利用科研知識圖譜,生成針對特定領域的全面知識庫。
通過充分利用協同創新網絡平台的大量研究論文和專利,城大科研團隊將進一步訓練和微調一個基於大型語言模型的專業領域「科創 GPT」,即 STIGPT(Science, Technology and Innovation GPT)。這個生成式人工智能模型能夠利用語意搜索、智 能推薦和度身訂造的個人化內容生成,為研究機構和科研人員,提供可促進知識共 創的人工智能助理服務。
同時,團隊將開發「聯邦學習技術」,以去中心化的訓練方法,促進平台上的用 戶,共同訓練及微調科研知識圖譜和大型語言模型。這項技術能在提高大型語言模 型的準確性和適應性的同時,確保數據安全和保障個人隱私,並通過科創 GPT大模型,為用戶提供個人化及適用於其特定領域的科技創新服務。
另外,城大研究團隊亦將開發一個「低代碼智能系統開發平台」,可以簡化及降低 程式編寫的難度,令機構用家能夠以最少的編程工作量,制定及實現數碼轉型解決方案,從而顯著降低使用門檻,大幅提升營運效率。
研究團隊預期,通過整合科創 GPT 與科研之友,可以打造出全球首個具有生成式人工智能的智慧協同創新網絡平台,以連繫各間大學和企業的研究人員,共同創造知識產權。這項研發成果也可以推動、加速各種科技創新服務的數碼化轉型,包括智慧科研管理、學術會議出版服務、研究成果推廣,以及技術轉移服務等。這些轉型 將帶來更高效率的決策過程、更簡化的流程,並可以加強政產學研之間的合作。
在城大的創新創業旗艦計劃 HK Tech 300 的支持之下,馬教授的科研團隊已成立了初創「創新城技術服務有限公司」(InnoCity.com),藉此把研究成 果商品化,尤其專注於生成式人工智能在技術轉移中的應用,以開拓當中充滿潛力及前景的市場機遇。