央企通信巨頭,牽頭搞起了一個開源社區?
而且模型、數據等各種資源應有盡有,還有學習資料和交流空間。
魔樂社區不只有在線平臺,還在線下正式成立了理事會,對社區進行管理建設。
央企牽頭,魔樂社區理事會正式成立
魔樂社區是一個人工智能社區,提供人工智能工具、模型、數據的托管、展示與應用協同服務,為人工智能開發及愛好者搭建開放的學習交流平臺,能夠幫助每一位開發者學習獲取領先的 AI 技術。
理事會是魔樂社區的管理機構,由全產業鏈共同建設、共同運營、共同享有,負責把控社區的發展方向、制定長期規劃,并對具體業務提供指導。
首批理事會成員涵蓋AI 芯片企業、模型、數據和工具企業、科研機構及生態組織等,共計 14 家單位。
在遴選過程中,發起者將整個 AI 產業分為不同環節后,在每一環節中選擇具有代表性且認可社區愿景、使命和目標,并愿意向社區持續貢獻的機構協商,然后敲定名單。
最終確定的首批成員如下(按全稱拼音排序):
未來,魔樂社區還將通過理事會深化與高校、科研機構及企業的合作,吸引更多成員加入,并深度整合技術、人才與產業資源。
魔樂社區理事會,具體由治理、建設、運營三個委員會,以及秘書處四個部分組成。
其中,治理委員會負責戰略及各類裁決,建設委員會聚焦技術標準與社區網站建設,運營委員會負責各類運營活動,秘書處提供各類協調和支持。
兩名及以上有共同興趣和目標的社區用戶,可向相關委員會提案成立 SIG,針對具體問題進行專項攻關。
另外理事會還通過治理架構和章程,設置淘汰機制,督促理事會成員積極參與社區事務,避免出現 " 聚而不合 " 的問題。
當然,魔樂社區理事會也會盡力保證參與者在社區中的獲得感,從而提高成員的行動意愿,確保社區的長期運行。
總之,理事會的成立,將為魔樂社區未來的發展提供更加堅實的組織保障。
算力、模型、數據,應有盡有
那么,魔樂社區到底能夠提供什么樣的資源呢?
首先,是各種模型、數據集、模型工具等 AI 開發者常用的資源。
以模型為例,魔樂社區當中包含了文本、圖像、音頻等各種模態(包括多模態)的模型,并且還有針對不同算力設施和模型工具的優化版本。
像 DeepSeek、Qwen,還有智譜等等知名開源模型,都被收錄在列,關鍵是這些模型還都完成了國產化硬件適配。
直接體現就是社區中的在線體驗空間,可以通過主流開源 SDK 快速創建屬于自己的 AI 應用,并且支持分享,讓非開發者也能在線試玩。
這和學術界更多關注理論研究的模式不無關聯,但更重要的原因是缺乏實踐的土壤,成果難以被產業界關注認可。
不過有了社區的幫助,學術成果就可以通過 demo 的形式更加直觀地被展現,讓不懂 AI 的人都能夠看到成果的價值,從而讓成果更迅速地被認識、認可。
所以,上海 AI 實驗室積極與魔樂社區合作,貢獻了大量的模型和數據資源,同時其下屬的 OpenDataLab 也以理事會成員的身份加入了社區,積極投身到了社區建設中。
與此同時,從魔樂社區中受益的不僅是學術界,還有中小企業。
硅基智能是一家 AI 創新企業,目前的主攻方向是 AI 數字人。
其生態合作部門負責人介紹,硅基智能在數字人技術本身已經擁有了優秀的成果,但在此之外,負責為其數字人提供語言內容的大模型,卻并非其強項。
而開源社區中的語言模型,就可以很好地彌補這一不足,幫助其完善整個產品鏈條。
享受開源模型帶來的便利的同時,硅基智能也將其擁有的數字人技術貢獻出來,供其他開發者使用,同時獲得使用者的反饋意見,形成正向循環。
從這兩個例子當中,可以看到魔樂社區確實在產學研之間架起了橋梁,起到了帶動整個產業協同發展的關鍵作用。
未來,魔樂社區還將考慮與高校進行聯合人才培養,讓開源社區的版圖進一步擴大。
為什么要有魔樂,GitHub 不香嗎?
那么,在國內外都已經不缺開源社區的情況下,為什么依然需要一個魔樂呢?
第一個原因,是現有開源社區——特別是 AI 開源社區——開放性依然存在不足。
眾所周知,GitHub 是全球最大的開源代碼倉庫。
但在大模型時代,GitHub 未能及時有效地提供模型權重和數據集的開源土壤,于是誕生出了 Hugging Face 這一模型平臺。
Hugging Face 雖然是模型開發者的不二之選,但到了實際應用環節,依然有一部分需求無法通過 Hugging Face 得到解決。
基礎模型在實際應用之前,需要和模型工具進行適配,實際場景中的模型工具多種多樣,但 Hugging Face 目前主要支持的還是自己的工具。
這一現象,也引起了部分開發者對其開放性產生了懷疑。
另一方面,開源模型、數據、工具未形成良性協同,比如開源模型的作者,更關注如何訓練出模型,而不會去考慮適配不同的異構化算力和模型工具。
這種局面的直接原因是不同領域之間的開源主體缺乏有效協同,往往是自掃門前雪。
但并非所有開源主體都有雄厚實力,能夠將成果開源已經是值得鼓勵的事,不能也不應該對開發者在適配工作中出現的不足進行苛責。
當然,問題也客觀存在,因此需要想其他辦法去解決這個問題,就需要有人在中間環節當中承擔統籌調度的職責。
第三,隨著人類在開源道路上的腳步不斷前進,一些具體的問題也開始逐漸顯現。
以數據為例,目前數據的版權、所有權、傳播權等均存在爭議,且數據開源與商業化之間存在博弈,無法通過現有開源協議得到完全解決。
除了正向的訓練數據之外,大模型安全還需要一些敏感數據,但這些數據又不宜公開傳播,因此成為了開源面臨的一個新困境。
而魔樂社區的出現,正是力求解決這些困境。
首先在開放性上,魔樂社區堅持中立和公益的原則,對所有類型的算力、模型、工具和數據都敞開懷抱,而不是做成云服務商的附屬。
另外還可以組織不同環節上的開發者共同對項目進行完善建設,用社區的力量解決單個開發者無力完成的協調適配工作。
開發者在開源工作中面臨的現實問題,也可以通過社區進行整理匯總,形成更高屋建瓴的行業洞察,再通過社區力量,與整個社會更好地協調、解決問題。
所以,在已經有了 GitHub、Hugging Face,以及國內開源平臺的情況下,依然需要一個魔樂這樣能夠串聯協調整個產業鏈的強有力組織者。
未來的魔樂社區,將持續匯聚人工智能全產業鏈力量,構建開放、協同、包容的 AI 生態,加速國產人工智能技術的創新與落地。
魔樂社區地址:
https://modelers.cn/
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —
點亮星標
科技前沿進展每日見