導(dǎo)讀:
基于開源人工智能的特點、價值與挑戰(zhàn),本研究提出“合作開源”的適應(yīng)性治理模式。
2025年1月,由中國大模型初創(chuàng)企業(yè)深度求索開發(fā)的大語言模型DeepSeek-R1,通過使用混合專家架構(gòu)(MoE)、多頭潛在注意力(MLA)機制等多項創(chuàng)新技術(shù),以低訓(xùn)練成本、相對優(yōu)異的性能、開源使用的特點引發(fā)廣泛關(guān)注。谷歌前首席執(zhí)行官埃里克·施密特(Eric Schmidt)在《華盛頓郵報》的專欄評論中指出,DeepSeek的發(fā)布標(biāo)志著全球AI競賽迎來新的轉(zhuǎn)折點。[1]
一、不是例外是常態(tài):開源技術(shù)的全球興起與發(fā)展
“開源”全稱為開放源代碼(Open Source Code),是指軟件的源代碼可以被公開地獲取、使用、修改和分發(fā),具有免費獲取、自由使用、自主修改、自行分發(fā)的特點。與開源相對應(yīng)的是閉源,指軟件的源代碼不向公眾開放,僅供特定用戶或組織使用的一種模式。開源最早興起于20世紀(jì)60年代,麻省理工學(xué)院計算機專業(yè)的學(xué)生經(jīng)常寫代碼彼此共享。20世紀(jì)80年代,理查德·斯托曼(Richard Stallman)出于對專有軟件限制模式的反思,發(fā)起了開源運動并發(fā)表了著名的《GNU宣言》,提出軟件“四大自由”(自由運行、學(xué)習(xí)研究、修改代碼、分享傳播),要求通過開源協(xié)作開發(fā)完整的操作系統(tǒng)替代專有系統(tǒng),推動“自由軟件社區(qū)”開源。1998年,網(wǎng)景公司宣布開放Navigator瀏覽器源代碼,成為開源軟件發(fā)展歷史上的重要轉(zhuǎn)折點,開源開始受到更多關(guān)注。之后開源技術(shù)在全球蓬勃發(fā)展,在各領(lǐng)域得到廣泛應(yīng)用。2023年,全球最大的代碼托管平臺GitHub上的托管項目倉(repository)已超過4.2億個,全球開源軟件項目數(shù)量穩(wěn)定增長。[2]開源技術(shù)被廣泛應(yīng)用于云計算、大數(shù)據(jù)、人工智能、物聯(lián)網(wǎng)等領(lǐng)域,被眾多公司企業(yè)、研發(fā)機構(gòu)采用,協(xié)助部署高效靈活的算力資源,分析處理海量數(shù)據(jù),為機器學(xué)習(xí)和深度學(xué)習(xí)提供便捷開發(fā)工具,助力物聯(lián)網(wǎng)平臺可靠發(fā)展等。
雖然開源運動早期呈現(xiàn)出“技術(shù)極客的激進(jìn)行動”特征,但這種“激進(jìn)”表象的背后,是技術(shù)理想主義與商業(yè)壟斷的對抗以及極客文化對傳統(tǒng)技術(shù)秩序的挑戰(zhàn)。以開放代碼為武器,挑戰(zhàn)專有軟件的壟斷格局,最終推動軟件開發(fā)從“少數(shù)企業(yè)的封閉游戲”變?yōu)椤叭騾f(xié)作的公共事業(yè)”。[3]開源技術(shù)之所以廣受歡迎,不僅是由于其能夠體現(xiàn)出技術(shù)民主化、社會共享協(xié)作的互聯(lián)網(wǎng)時代精神,更是確有諸多優(yōu)勢:開源軟件由技術(shù)社區(qū)協(xié)同開發(fā),通常成本很低,企業(yè)和個人無須支付高昂的軟件授權(quán)費用即可獲得高質(zhì)量的軟件和技術(shù);開源技術(shù)的源代碼可以自由獲取和修改,用戶可以根據(jù)自身需求進(jìn)行定制化開發(fā),靈活性高,能夠滿足不同的業(yè)務(wù)場景和功能需求;開源社區(qū)匯聚了大量的開發(fā)者和技術(shù)愛好者,他們可以共同參與項目的研發(fā)和改進(jìn),加速技術(shù)的迭代與創(chuàng)新,使得開源技術(shù)能夠快速適應(yīng)市場和技術(shù)的變化;開源軟件依托同行評審和社區(qū)生產(chǎn),以分散、協(xié)作的方式開發(fā),眾多開發(fā)者共同參與代碼的審查和測試,能夠及時發(fā)現(xiàn)和修復(fù)漏洞,保證軟件的質(zhì)量和可靠性。
如今,開源運動的理念已逐漸被普遍接納。在全球軟件生態(tài)中,開源并非少數(shù)和例外,而是現(xiàn)實中的默認(rèn)狀態(tài),開源已成為科技行業(yè)的基礎(chǔ)設(shè)施。美國2023年發(fā)布的《國家人工智能研發(fā)戰(zhàn)略計劃》明確提出,要“開發(fā)開源軟件庫和工具包”。英國2025年1月發(fā)布的《人工智能機遇行動計劃》也明確要求,“基礎(chǔ)設(shè)施要具有互操作性、代碼可重用性和開源性”。相關(guān)數(shù)據(jù)顯示,超過90%的企業(yè)都在不同程度地使用開源軟件。[4]
二、作為“數(shù)字公共產(chǎn)品”:開源技術(shù)蘊藏創(chuàng)新價值
2020年6月,聯(lián)合國秘書長安東尼·古特雷斯在《數(shù)字合作路線圖:執(zhí)行數(shù)字合作高級別小組的建議》報告中以開源軟件為核心、以公共價值為出發(fā)點提出了“數(shù)字公共產(chǎn)品”的概念:尊重隱私和遵守其他適用的國際和國內(nèi)法律、標(biāo)準(zhǔn)和最佳做法且無害的開源軟件、開放數(shù)據(jù)、開放人工智能模型、開放標(biāo)準(zhǔn)和開放內(nèi)容。這一概念將公共產(chǎn)品的范疇從傳統(tǒng)的物理世界延伸到數(shù)字領(lǐng)域,強調(diào)了數(shù)字資源在促進(jìn)全球公平、推動可持續(xù)發(fā)展以及解決全球性問題方面的重要作用。
作為數(shù)字公共產(chǎn)品的開源軟件,是互聯(lián)網(wǎng)技術(shù)發(fā)展的重要產(chǎn)物,深刻體現(xiàn)出互聯(lián)網(wǎng)開放、平等、協(xié)作、自由、普惠、進(jìn)化的核心精神。目前,包括OpenAI在內(nèi)的大多數(shù)前沿大語言模型普遍采用的是閉源策略,這背后有安全性、可控性、商業(yè)利益和地緣政治等因素的考量。[5]閉源模式強調(diào)標(biāo)準(zhǔn)化、控制訪問和知識產(chǎn)權(quán)保護(hù),開源模式則強調(diào)通過促進(jìn)合作、共享開發(fā)和透明度推動技術(shù)創(chuàng)新。在人工智能時代,開源被認(rèn)為是后起力量追趕前沿大模型、突破關(guān)鍵技術(shù)封鎖、實現(xiàn)彎道超車的一項策略。中國信息通信研究院的《全球開源生態(tài)洞察報告(2024年)》顯示,在全球活躍度排名前100位的開源軟件項目中,中國軟件項目占17%,僅次于美國(45%),排第2位。中國目前已有開源項目3000萬個,開源開發(fā)者超過900萬名。[6]自2023年8月以來,阿里旗下通義系列以“全尺寸、全模態(tài)、全場景”戰(zhàn)略總計開源了200多款大模型。2025年3月6日,阿里云發(fā)布并開源了通義千問QwQ-32B,該模型使用更小參數(shù)但在數(shù)學(xué)、代碼以及通用能力上整體比肩DeepSeek-R1,開源當(dāng)日就登頂了全球主流AI開源社區(qū)Hugging Face趨勢榜。而阿里云旗下視覺基座大模型萬相2.1(Wan2.1)在發(fā)布和開源后僅6天就登上了Hugging Face趨勢榜、模型空間榜兩個榜單,一度成為全球開源社區(qū)最受歡迎的模型。DeepSeek通過一篇論文詳細(xì)介紹了它的工作原理,并允許其他人實施該流程。[7]
三、辯證看待“全周期隱患”:開源技術(shù)的風(fēng)險研判
去中心化、共享協(xié)作、用戶創(chuàng)造,開源在全球范圍內(nèi)已成為規(guī)模龐大的軟件開發(fā)和技術(shù)創(chuàng)新力量。但開源也意味著在網(wǎng)絡(luò)安全、法律約束與社區(qū)協(xié)作方面具有高度的不穩(wěn)定性、不確定性和復(fù)雜性。2025年3月,工信部發(fā)布《關(guān)于防范針對DeepSeek本地化部署實施網(wǎng)絡(luò)攻擊的風(fēng)險提示》,其網(wǎng)絡(luò)安全威脅與漏洞信息共享平臺(CSTIS)監(jiān)測發(fā)現(xiàn)有攻擊者針對DeepSeek的本地化部署場景實施釣魚攻擊,傳播惡意程序,導(dǎo)致敏感信息泄露,系統(tǒng)數(shù)據(jù)被破壞,內(nèi)部網(wǎng)絡(luò)被入侵。而DeepSeek實現(xiàn)低成本高性能所依賴的“知識蒸餾技術(shù)”,在開源共享、數(shù)據(jù)安全、知識產(chǎn)權(quán)歸屬以及商業(yè)化應(yīng)用等方面的法律邊界尚未明確。[8]
對于大語言模型來說,其整個生命周期都面臨著安全隱患。一項系統(tǒng)洞察大語言模型全生命周期安全性的“全棧分類框架”顯示,其在數(shù)據(jù)準(zhǔn)備、預(yù)訓(xùn)練、后訓(xùn)練、代理部署以及商業(yè)化應(yīng)用的各個階段均存在多種安全風(fēng)險。[9]思科研究團(tuán)隊對DeepSeek-R1、OpenAI o1-preview和其他前沿模型可能涉及的六類有害行為(包括網(wǎng)絡(luò)犯罪、侵犯版權(quán)、虛假信息、騷擾欺凌、非法活動和一般傷害等)進(jìn)行了測評。測評發(fā)現(xiàn),DeepSeek的AI開發(fā)策略利用的三項核心原則:思維鏈提示(CoT)、強化學(xué)習(xí)和知識蒸餾,雖然在成本效益上有優(yōu)勢,但可能損害了模型的安全機制。[10]人工智能安全平臺Hiddenlayer對DeepSeek-R1的安全評測結(jié)論指出,該模型存在無法抵御簡單越獄攻擊、思維鏈推理可能會導(dǎo)致信息泄露等安全漏洞,由于較為缺乏有效的防護(hù)措施,極易受到算法越獄和潛在濫用的影響。
開源軟件的代碼透明雖然有利于漏洞的發(fā)現(xiàn)和修復(fù),但模型權(quán)重的開放獲取可能降低惡意行為者的攻擊門檻,使人工智能系統(tǒng)更易被武器化用于網(wǎng)絡(luò)攻擊、深度偽造等非法用途。由于開源人工智能生態(tài)系統(tǒng)缺乏訪問控制、集中監(jiān)督和明確的使用準(zhǔn)則,易遭受數(shù)據(jù)投毒和對抗攻擊,難以快速識別和應(yīng)對安全漏洞。惡意行為者可能利用開源模型不受限制的訪問權(quán)限,竊取訓(xùn)練數(shù)據(jù)、代碼腳本、模型系統(tǒng)等。2024年3月,Ray框架的漏洞被黑客利用,導(dǎo)致包括Uber、Amazon和OpenAI在內(nèi)的數(shù)千家公司面臨網(wǎng)絡(luò)攻擊威脅,黑客可借此竊取憑據(jù)、遠(yuǎn)程控制服務(wù)器和破壞AI模型。而且,開源人工智能項目的問責(zé)機制不完善,面對數(shù)據(jù)安全問題響應(yīng)遲緩并且經(jīng)常意見不一致??紤]到開源大模型將降低使用門檻并讓模型應(yīng)用更加規(guī)?;?、網(wǎng)絡(luò)化,開源模型生態(tài)中的濫用誤用情況可能變多。[11] 2024年加州SB 1047法案在地方立法機構(gòu)通過后被加州州長否決。利益相關(guān)方在普遍關(guān)心開源能否促進(jìn)人工智能發(fā)展的同時,也擔(dān)心開源人工智能是否會導(dǎo)致風(fēng)險的更快擴(kuò)散并帶來社會負(fù)外部性。
開源相關(guān)法律框架涵蓋了版權(quán)法、專利法、開源許可證以及數(shù)據(jù)保護(hù)法等多個重要組成部分,這些法律規(guī)范相互交織,共同構(gòu)建起保障開源項目合法有序開展的法律基石。開源許可證的多樣性和復(fù)雜性也增加了軟件法律合規(guī)的風(fēng)險。不同類型的開源許可證如GPL(通用公共許可證)、MIT(麻省理工學(xué)院許可證)等,對代碼的使用、修改和分發(fā)有著不同的規(guī)定,企業(yè)和組織在使用開源代碼時,如果對許可證條款理解不透徹,可能會面臨知識產(chǎn)權(quán)糾紛和法律訴訟。開源項目的全球協(xié)作帶來了法律適用與管轄權(quán)的問題,不同國家和地區(qū)的法律差異可能導(dǎo)致在開源項目中出現(xiàn)法律沖突。比如美國科技巨頭 OpenAI 就公開指控DeepSeek采用的“知識蒸餾”技術(shù)涉嫌“不當(dāng)蒸餾”,違反了OpenAI的使用條款。[12]開源項目迭代速度快,增加了技術(shù)維護(hù)的難度,企業(yè)和組織需要不斷跟進(jìn)項目的更新,以確保系統(tǒng)的穩(wěn)定性和安全性。
由于開源社區(qū)的成員來自不同的背景和文化,可能存在溝通障礙和價值觀沖突,這也會影響開源項目的協(xié)作效率和凝聚力。Linux內(nèi)核社區(qū)是一個龐大且具有全球影響力的開源社區(qū),2025年初,關(guān)于在Linux內(nèi)核開發(fā)中是否應(yīng)該更多地引入Rust語言的問題,項目領(lǐng)導(dǎo)者與資深內(nèi)核開發(fā)者由于意見不一致爆發(fā)了激烈的爭議,最終領(lǐng)導(dǎo)者退出。[13]聯(lián)系之前一批俄羅斯程序維護(hù)員被移出Linux內(nèi)核社區(qū)的事件,雖然主要開發(fā)者聲稱是由于“各種合規(guī)要求”,但這也顯露出在開源社區(qū)內(nèi)部,理性溝通與團(tuán)隊信任方面存在諸多問題。
四、“合作開源”的適應(yīng)性治理:技術(shù)、法律與社會的互構(gòu)
隨著我國人工智能法律治理進(jìn)入系統(tǒng)集成階段,圍繞實現(xiàn)人工智能高質(zhì)量發(fā)展和高水平安全良性互動的治理主旨,需要引入適應(yīng)性的治理理念以統(tǒng)籌安全與發(fā)展,應(yīng)對人工智能多重屬性所構(gòu)成的復(fù)雜系統(tǒng)的治理需求,并高度容納技術(shù)未來發(fā)展的不確定性和未知前景。[14] 2024年12月一項覆蓋23個國家的110份針對企業(yè)(54%)、學(xué)術(shù)研究機構(gòu)(36%)、非營利組織(11%)等技術(shù)社群對象的調(diào)查顯示,與許多敘述相反,三分之二的受訪者沒有見過風(fēng)險太大而無法部署的開源人工智能應(yīng)用案例,包括聊天機器人、編碼助手、摘要提取等。[15] 2024年7月底,美國國家電信和信息管理局(NTIA)發(fā)布報告,針對開源模型的“增量風(fēng)險”的判斷提供了與閉源模型、其他現(xiàn)有技術(shù)以及現(xiàn)有開源模型相比較的三個參考標(biāo)準(zhǔn)。換言之,只要與這些參考標(biāo)準(zhǔn)相比沒有出現(xiàn)新風(fēng)險,即不屬于被納入監(jiān)管范疇的增量風(fēng)險。
開源對于中國科技創(chuàng)新的跨越式發(fā)展至關(guān)重要,開源為中國彌補過去長期存在的問題創(chuàng)造了不可或缺的機遇。開源之于中國,不是短期之內(nèi)應(yīng)對科技脫鉤的權(quán)宜之計,而應(yīng)被視為中國創(chuàng)新范式轉(zhuǎn)變的重要契機和優(yōu)先戰(zhàn)略。關(guān)于開源的觀念,不僅需要從辯證的角度來思考“自主可控”“自主創(chuàng)新”與“開放合作”之間的關(guān)系,更需要堅定開源姿態(tài)深度嵌入國際供應(yīng)鏈中,形成國際間廣泛的參與和創(chuàng)新。因此,對于開源生態(tài)系統(tǒng)的安全治理,不應(yīng)局限于傳統(tǒng)的“開放與封閉”的二元對立,而應(yīng)構(gòu)建具有更高靈活性、敏捷性的治理機制與決策框架,以有效地應(yīng)對多變的社會現(xiàn)象和不斷涌現(xiàn)的全球性挑戰(zhàn)。[16]
技術(shù)創(chuàng)新不應(yīng)以犧牲安全為代價,需要在開放共享與風(fēng)險防控之間保持平衡。對于開源模型的合作治理,需要依賴多方策略的有效聯(lián)動,形成合作開源模式。開源本身就蘊藏著合作精神,合作開源則是希望能夠盡快提升開源軟件風(fēng)險監(jiān)測水平,保證開源項目的代碼質(zhì)量、漏洞防護(hù)、許可證合規(guī)等;明確人工智能領(lǐng)域相關(guān)技術(shù)的競爭自由與模仿自由規(guī)則,就人工智能相關(guān)技術(shù)建立開源標(biāo)準(zhǔn);通過構(gòu)建開放包容的技術(shù)促進(jìn)政策[17],最大程度釋放技術(shù)、市場與社會活力,推動人工智能產(chǎn)業(yè)繁榮發(fā)展及相關(guān)技術(shù)廣泛應(yīng)用,帶動我國技術(shù)路線與產(chǎn)業(yè)發(fā)展方向在國際競爭中占據(jù)有利地位。
合作開源要求在技術(shù)治理、法律保護(hù)、國際合作、社會共同體四個方向上形成良性共進(jìn)。如果說當(dāng)年開源運動誕生之初的《GNU宣言》促進(jìn)了開源技術(shù)社區(qū)生態(tài)的良性循環(huán),那么合作開源治理則希望能夠?qū)⑦@一理想推廣到國際、國家與社會層面。合作開源為技術(shù)創(chuàng)新提供了良好的國際環(huán)境與社會保障,有效的開源治理能夠建立起穩(wěn)定的社區(qū)秩序,促進(jìn)開發(fā)者之間的協(xié)作與交流,為技術(shù)創(chuàng)新提供人才和智力支持。合作開源還能夠規(guī)范開源項目的開發(fā)流程和維護(hù)標(biāo)準(zhǔn),提高技術(shù)創(chuàng)新的可靠性與可持續(xù)性。
技術(shù)治理對于保障開源軟件的安全可控具有不可或缺的作用。美國R Street研究所發(fā)布的報告指出,可以通過受控訪問、分層訂閱、聯(lián)邦學(xué)習(xí)等方法平衡開源的安全與創(chuàng)新難題。[18]如通過開源護(hù)欄(rails)[19] 、增強開源模型、精確知識編輯(PKE)[20]等方法,進(jìn)一步提升模型在實際應(yīng)用中的安全性與可靠性。由IBM、Meta等全球50多個創(chuàng)始成員和合作者聯(lián)合發(fā)起成立的全球人工智能聯(lián)盟(AI Alliance)社區(qū),也對當(dāng)前開源人工智能的基準(zhǔn)標(biāo)準(zhǔn)提出了更高的要求,包括自動紅隊和護(hù)欄機制等,并建議在確保部署環(huán)境可控的基礎(chǔ)上再使用開源模型。
完善開源法律體系建設(shè)是保障開源項目健康發(fā)展的關(guān)鍵舉措。當(dāng)前,開源技術(shù)的發(fā)展速度遠(yuǎn)超法律更新速度,導(dǎo)致開源項目在很多方面缺乏明確的法律依據(jù)。內(nèi)嵌式的開源立法可分步明確開源項目的法律地位、開發(fā)者權(quán)利義務(wù),以及開源許可證的法律效力等關(guān)鍵問題。比如歐盟針對開源模型進(jìn)行單獨定義并設(shè)置復(fù)雜的“開源豁免+豁免例外”規(guī)則機制,將開源模型完全納入法律規(guī)制之后再進(jìn)行有限度的利益平衡。在版權(quán)方面,應(yīng)進(jìn)一步細(xì)化關(guān)于開源軟件版權(quán)歸屬的規(guī)定,根據(jù)開發(fā)者的實際貢獻(xiàn)程度、開發(fā)時間、開發(fā)目的等因素,準(zhǔn)確判斷版權(quán)歸屬。對于共同開發(fā)的代碼,應(yīng)明確各方的版權(quán)份額和使用權(quán)限,避免版權(quán)糾紛。在許可證方面,需要使開源許可證的條款標(biāo)準(zhǔn)化和規(guī)范化,統(tǒng)一不同許可證的關(guān)鍵條款解釋,減少因理解差異而引發(fā)的爭議。建立開源許可證的備案和審查制度,確保許可證的合法性和合規(guī)性。對于侵犯開源軟件版權(quán)、違反開源許可證規(guī)定等行為,應(yīng)依法予以處罰,提高違法成本。
積極參與國際規(guī)則制定是提升我國在開源領(lǐng)域國際話語權(quán)的重要途徑。開源技術(shù)的全球化發(fā)展使得國際間的法律協(xié)調(diào)與合作變得越來越重要。我國應(yīng)加強與其他國家和地區(qū)的溝通與交流,積極參與國際開源法律規(guī)則的討論和制定,推動建立公平、合理、有效的國際開源法律秩序。與開放源代碼促進(jìn)會(OSI)建立合作關(guān)系,參與國際開源會議和活動,分享我國在開源治理方面的經(jīng)驗和成果。加強國際間的信息共享和技術(shù)協(xié)作,共同應(yīng)對跨國界的技術(shù)風(fēng)險,提高技術(shù)監(jiān)管的效率和效果。
為開源文化營造良好的社會環(huán)境,形成健康的“開源共同體”。開源本身就蘊藏著連接包容的合作價值。通過舉辦開源技術(shù)活動,如開源技術(shù)峰會、開源代碼競賽等,提高社會各界對開源技術(shù)的認(rèn)知度和認(rèn)可度。邀請行業(yè)專家、知名開發(fā)者分享開源技術(shù)的最新進(jìn)展和應(yīng)用案例,展示開源技術(shù)的優(yōu)勢和價值,吸引更多人關(guān)注開源技術(shù)。舉辦開源代碼競賽,為開發(fā)者提供展示才華的平臺,激發(fā)他們的創(chuàng)新熱情和參與開源項目的積極性。利用媒體、網(wǎng)絡(luò)平臺等渠道,傳播開源文化的理念和精神,讓更多人了解開源技術(shù)的開放、共享、協(xié)作特點,營造全社會支持開源技術(shù)發(fā)展的良好氛圍。針對公眾對開源技術(shù)安全性、知識產(chǎn)權(quán)等方面的擔(dān)憂,進(jìn)行詳細(xì)的解釋和說明,讓公眾了解開源技術(shù)在安全性和知識產(chǎn)權(quán)保護(hù)方面的措施和機制,增強公眾對開源技術(shù)的信任。鼓勵社會公眾積極參與技術(shù)監(jiān)管,通過建立舉報機制和信息公開平臺,讓公眾能夠及時發(fā)現(xiàn)和舉報開源技術(shù)中的違規(guī)行為,形成全社會共同參與的監(jiān)管氛圍。
來源:《青年記者》2025年第10期
作者:方師師,上海社會科學(xué)院新聞研究所副研究員);王易鑫,上海社會科學(xué)院新聞研究所碩士研究生
