3月20日,北京智源人工智能研究院舉辦“智源悟道1.0 AI研究成果發布會暨大規模預訓練模型交流論壇”,并發布我國首個超大規模智能模型系統“悟道1.0”。
據悉,“悟道1.0”由智源研究院學術副院長、清華大學唐杰教授領銜,帶領來自北京大學、清華大學、中國人民大學、中國科學院等單位的100余位AI科學家團隊聯合攻關,取得了多項國際領先的AI技術突破,形成超大規模智能模型訓練技術體系,訓練出包括中文、多模態、認知、蛋白質預測在內的系列模型,勇闖通用智能發展前沿,構建我國人工智能應用基礎設施。同時,與龍頭企業共同研發工業級示范性應用,加快大規模智能模型應用生態建設。
北京市科委、中關村管委會副主任許心超介紹,北京將依托在人工智能領域的科技資源和產業發展優勢,支持建設智源研究院等一批世界一流新型研發機構,前瞻部署人工智能基礎研究,加強關鍵核心技術攻關,推動人工智能占先。
北京市超前部署通用智能發展,支持智源研究院牽頭建設“超大規模人工智能模型訓練平臺”,“悟道1.0”即為該平臺的重要內容,通過研發超大規模信息智能模型和生命模型,推動電子信息、生物醫藥等基礎科學科研范式變革,加速科學研究進程。同時,該平臺將推動創新企業及個人開發者基于大模型構建智能化水平更高的場景應用,賦能實體經濟智能化升級,促進經濟高質量發展。
“悟道”模型技術委員會主任、智源研究院學術副院長唐杰教授介紹了“悟道”模型的戰略布局及階段性成果。“悟道1.0”先期啟動了4個大模型的研發:以中文為核心的大規模預訓練模型“悟道·文源”、首個公開的中文通用圖文多模態預訓練模型“悟道·文瀾”、我國首個具有認知能力的超大規模預訓練模型“悟道·文匯”、超大規模蛋白質序列預測預訓練模型“悟道·文溯”。
其中,“悟道·文源”的目標是構建完成全球規模最大的以中文為核心的預訓練語言模型,在中英文等多個世界主流語言上取得最好的處理能力,在文本分類、情感分析、自然語言推斷、閱讀理解等多個任務上超越人類平均水平,探索具有通用能力的自然語言理解技術,并進行腦啟發的語言模型研究。目前,“悟道·文源”模型參數量達26億,具有識記、理解、檢索、數值計算、多語言等多種能力,并覆蓋開放域回答、語法改錯、情感分析等20種主流中文自然語言處理任務。
“悟道·文瀾”的目標是突破基于圖、文和視頻相結合的多模態數據的預訓練理論難題,并最終生成產業級中文圖文預訓練模型和應用,并在多個評測應用上超過國際最高性能。目前,“悟道·文瀾”模型參數量達10億,模型性能已到達國際領先水平,并已對外開放API。
發布會上,為了展示如何使用“悟道·文瀾”模型,智源研究院聯合中國人民大學高瓴人工智能學院和一覽群智公司,推出了兩款基于該模型的小應用,其中“賦魂”AI小程序,可以為用戶上傳的照片配文,“AI心情電臺”小程序可以利用圖片和歌詞的相關性,為用戶上傳的照片搭配最合拍的音樂。
“悟道·文匯”則致力于從認知的角度研究通用人工智能中一系列更本質問題,側重進一步提升和發展預訓練模型基于邏輯、意識和推理的認知能力,目標是研發出千億至萬億級別參數量的、更通用且性能超越國際水平的預訓練模型,搭建預訓練模型體系,同時形成認知智能生態。目前,“悟道·文匯”模型的參數規模達113億,在多項任務中“悟道·文匯”的表現已經接近突破圖靈測試,通過簡單微調就已經實現AI作詩、AI作圖、AI制作視頻、圖文生成、圖文檢索、復雜推理。
“悟道·文溯”最終目標是以基因領域認知圖譜為指導,研發出十億參數規模、可以處理超長蛋白質序列的超大規模預訓練模型,在基本性能、可解釋性和魯棒性等多個方面達到世界領先水平。
據唐杰介紹,此次發布的“悟道”大模型1.0版本,已經完成了百億和千億參數規模的預訓練,在多個國際評測中取得世界第一,在部分任務上具有一定認知能力。今年,還將陸續發布后續迭代版本,面向產業界開放使用。
“悟道”模型應用生態建設分為三個主要階段,分別關注示范應用、API生態及社區運營維護等。目前,智源研究院已啟動第一階段的示范性應用搭建,正與快手、搜狗、360、阿里、智譜華章、一覽群智、循環智能、新華社等機構就模型的應用進行洽談,聯合構建一批工業級示范性應用。
下一步,智源研究院將加強用戶的開發,做好用戶服務,與AI龍頭企業共同研發更多工業級示范性應用,并將加快推動API生態構建及社區運營迭代工作,通過舉辦學術交流、技術挑戰賽等活動提高“悟道”模型的影響力,吸引更多AI企業、研究機構、個人開發者等開展基于模型的應用開發工作,推動構建國際領先的超大規模智能模型應用生態。
圖片來源:智源研究院