【智慧城市網 企業關注】2024年,“兩會”政府工作報告中首次提到“人工智能+”行動,人工智能被視為形成新質生產力的重要引擎。隨著人工智能技術的快速演進,AI大模型已成為全球科技競爭的新高地、未來產業的新賽道、經濟發展的新引擎,展現出巨大的發展潛力和應用前景。AI大模型的應用領域廣泛,包括但不限于辦公、制造、金融、醫療、政務等,這些領域的創新和發展為AI大模型產業注入了強大的活力。當前,我國AI大模型產業呈現蓬勃發展的態勢,通用大模型、行業大模型、端側大模型如雨后春筍般涌現,并在多個領域取得了顯著成果。
大模型是典型的人工智能平臺賦能性技術,加快我國大模型技術創新和應用落地,需要加強大模型評測體系研究,搭建全量測試題庫、自動測試平臺和高效測試方法,降低研發和使用成本,滿足大模型能力持續監測和能力迭代的要求,從而推動我國自主可控的大模型產業生態繼續向前邁進。
中國信息通信研究院(簡稱“中國信通院”)長期研究大模型發展態勢,自2022年3月啟動大模型評測技術研究以來,根據產業發展不斷優化迭代,已形成一套覆蓋范圍全、評測指標精、需求映射準的大模型評測體系。此次全新升級的“中國信通院可信AI評測服務——大模型評估測試體系(2024)”覆蓋七大模塊:大模型基礎軟硬件及集群系統、大模型能力基準測試、大模型平臺、基礎大模型、行業大模型、智能應用和大模型能力安全測試。
具體來說,評測體系一是為滿足大模型訓練及推理的軟硬件系統、軟硬件系統前沿技術能力以及當前我國AI軟硬件兼容適配及能力遷移需求,提供多種能力驗證服務;二是從綜合能力、通用能力、行業和應用能力方面構建大模型基準測試體系;三是從大模型平臺、基礎大模型、行業大模型和大模型智能應用全鏈條提供產品評估服務;同時針對大模型各種服務形式,全方位開展MaaS安全、基準安全、模型安全、內容安全、數據安全和服務安全等評估,助力行業安全發展。
“中國信通院可信AI評測服務——大模型評估測試體系(2024)”作為業界專業面向大模型的可信AI測評體系,從技術、應用、安全等各方面對大模型相關產品進行評估測試,為“人工智能+”行業落地保駕護航。
規范行業發展,樹立標桿應用。通過科學、客觀的評測,有利于更好地理解和把握大模型技術的發展趨勢,為政府部門提供科學依據,支持國家在人工智能領域的政策制定和頂層設計。通過有效篩選出高性能、高可靠性的大模型產品服務,并針對測試過的大模型標桿企業開展應用推廣活動,樹立可推廣、可復制、高價值的標桿產品應用。
推動應用落地,加速產業化進程。不僅幫助供需各方評估和優化其模型性能,激發廠家優化迭代產品,有利于形成行業市場良性競爭環境;還可以通過提供測試指標、方法和工具,促進技術標準化,拓展大模型應用的廣度和深度,加速產業化進程,實現技術、應用與產業的協同發展。
幫助用戶了解產品,協助企業驗收。一方面,大模型評測是一項重要的驗收工具,可以幫助企業全面檢驗產品各項指標,并了解性能瓶頸和改進方向,不斷優化模型結構和算法;另一方面,通過參與評測并與同行交流,企業能夠獲取更多的行業信息和優秀實踐,提升技術水平和競爭力。
部分已通過評測企業(持續更新)
版權與免責聲明:
凡本網注明“來源:智慧城市網”的所有作品,均為浙江興旺寶明通網絡有限公司-智慧城市網合法擁有版權或有權使用的作品,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。已經本網授權使用作品的,應在授權范圍內使用,并注明“來源:智慧城市網”。違反上述聲明者,本網將追究其相關法律責任。
本網轉載并注明自其它來源(非智慧城市網)的作品,目的在于傳遞更多信息,并不代表本網贊同其觀點或和對其真實性負責,不承擔此類作品侵權行為的直接責任及連帶責任。其他媒體、網站或個人從本網轉載時,必須保留本網注明的作品第一來源,并自負版權等法律責任。
如涉及作品內容、版權等問題,請在作品發表之日起一周內與本網聯系,否則視為放棄相關權利。