□ 張欣 李敘燃
生成式人工智能技術(shù)正以前所未有的速度和影響力重構(gòu)內(nèi)容生產(chǎn)格局。近期,我國人工智能初創(chuàng)企業(yè)深度求索(DeepSeek)公司先后推出了DeepSeek-V3、DeepSeek-R1、DeepSeek-Janus-Pro-7B等開源大模型,在內(nèi)容生成、多模態(tài)理解等方面展現(xiàn)出卓越性能。目前,DeepSeek應(yīng)用軟件的日活用戶數(shù)已突破三千萬人,創(chuàng)下人工智能應(yīng)用日活用戶數(shù)量增速的全球紀(jì)錄。DeepSeek創(chuàng)新性地運用專家混合機制和多頭潛在注意力機制等技術(shù),顯著提升了數(shù)據(jù)訓(xùn)練效率并降低內(nèi)存占用。基于H800 GPU集群的訓(xùn)練成果可與頂尖大模型比肩,打破了高算力依賴的傳統(tǒng)大模型訓(xùn)練范式。通過開源生態(tài)戰(zhàn)略,DeepSeek擴大了高性能人工智能的可及性,推動了內(nèi)容生產(chǎn)領(lǐng)域工具與應(yīng)用的繁榮發(fā)展,但與此同時,也引發(fā)了社會各界對于生成式人工智能著作權(quán)問題的再度關(guān)注。
盡管DeepSeek在生成式人工智能領(lǐng)域取得重要進展,但其技術(shù)本質(zhì)仍是基于海量數(shù)據(jù)訓(xùn)練和概率計算的復(fù)雜運算過程。從技術(shù)機理看,生成式人工智能的“創(chuàng)作”過程具有三個顯著特征:首先,模型能力的形成深度依賴海量優(yōu)質(zhì)數(shù)據(jù)的積累。通過對文本、圖像等數(shù)據(jù)的深度學(xué)習(xí),人工智能構(gòu)建起包含千億參數(shù)的知識網(wǎng)絡(luò),從而獲得內(nèi)容生成能力。其次,內(nèi)容生成需要用戶輸入提示詞觸發(fā)。用戶可根據(jù)需求對提示詞進行反復(fù)調(diào)整,以獲得期望的輸出內(nèi)容。最后,基于概率采樣機制的內(nèi)容生成過程具有隨機性。以Transformer架構(gòu)為例,模型通過學(xué)習(xí)詞語出現(xiàn)的概率分布構(gòu)建知識體系,在生成過程中依據(jù)概率預(yù)測和采樣確定輸出內(nèi)容,因此呈現(xiàn)出多樣性和不確定性的特點。
這種技術(shù)特性投射到著作權(quán)法領(lǐng)域時,帶來了兩方面法律挑戰(zhàn):一為訓(xùn)練數(shù)據(jù)使用引發(fā)的著作權(quán)侵權(quán)風(fēng)險;二為人工智能生成內(nèi)容(AIGC)的可版權(quán)性認(rèn)定問題。就前者而言,當(dāng)前人工智能模型主要通過網(wǎng)絡(luò)爬取獲取訓(xùn)練數(shù)據(jù),其中包含大量受著作權(quán)保護的作品。這一做法是否構(gòu)成侵權(quán)、能否適用“合理使用”規(guī)則已引發(fā)全球關(guān)注。典型案例是《紐約時報》訴微軟和OpenAI的著作權(quán)侵權(quán)糾紛?!都~約時報》指出,ChatGPT通過訓(xùn)練數(shù)據(jù)集Common Crawl獲取其報道內(nèi)容,并能生成與付費文章高度相似的內(nèi)容。而OpenAI則主張這種使用應(yīng)受“合理使用”規(guī)則保護。該案的判決結(jié)果將對人工智能領(lǐng)域的著作權(quán)保護產(chǎn)生重要影響。就后者而言,核心爭議在于人類通過提示語是否能夠?qū)嵸|(zhì)性控制生成內(nèi)容。支持觀點認(rèn)為,人類通過精心設(shè)計提示詞、參數(shù)設(shè)置和反復(fù)調(diào)整,體現(xiàn)了對生成內(nèi)容的“選擇和安排”以及“審美判斷”,且在一些模型上,可通過隨機種子實現(xiàn)內(nèi)容復(fù)現(xiàn)和持續(xù)微調(diào),從而確立對生成內(nèi)容的控制。反對觀點則指出,人工智能的概率性輸出機制導(dǎo)致相同提示語可能產(chǎn)生差異化內(nèi)容,人類僅能通過反復(fù)嘗試篩選結(jié)果,這種類似于“反復(fù)抽樣”的過程,難以構(gòu)成對生成內(nèi)容的實質(zhì)控制,即便能通過隨機種子復(fù)現(xiàn)特定結(jié)果,也不改變其隨機性本質(zhì)。此外,還有觀點從經(jīng)濟學(xué)視角提出,生成式人工智能重塑了內(nèi)容生產(chǎn)的產(chǎn)業(yè)形態(tài),形成了從數(shù)據(jù)輸入到模型輸出的完整產(chǎn)業(yè)鏈,由于人工智能生成內(nèi)容的邊際成本接近于零,對其賦予著作權(quán)保護可能會增加交易成本,限制內(nèi)容傳播與使用,不利于創(chuàng)新發(fā)展與經(jīng)濟增長。技術(shù)與產(chǎn)業(yè)的雙重變革對著作權(quán)法的激勵機制提出了新的挑戰(zhàn)。
黨的十八大以來,我國始終高度重視人工智能發(fā)展,將其作為推動科技創(chuàng)新和經(jīng)濟高質(zhì)量發(fā)展的重要引擎。黨的二十屆三中全會明確提出“加快發(fā)展新質(zhì)生產(chǎn)力”的戰(zhàn)略目標(biāo),這不僅為人工智能產(chǎn)業(yè)發(fā)展指明方向,更凸顯了構(gòu)建與之相適應(yīng)的著作權(quán)制度的緊迫性。《中共中央 國務(wù)院關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》的出臺,標(biāo)志著我國數(shù)據(jù)要素市場建設(shè)進入新階段。2024年《政府工作報告》和國家數(shù)據(jù)局等17部門聯(lián)合印發(fā)的《“數(shù)據(jù)要素×”三年行動計劃(2024—2026年)》進一步完善了數(shù)據(jù)基礎(chǔ)性制度框架,為市場主體參與數(shù)據(jù)要素開發(fā)利用提供政策保障。高質(zhì)量數(shù)據(jù)供給是提升人工智能模型能力的關(guān)鍵,在推進數(shù)據(jù)要素市場化配置過程中,需要平衡市場主體數(shù)據(jù)權(quán)益保護與數(shù)據(jù)價值挖掘。針對訓(xùn)練數(shù)據(jù)合法性判定,建議采取“個案分析、類型化治理”策略,同時積極探索開源數(shù)據(jù)集的合法使用機制。其次,應(yīng)當(dāng)認(rèn)識到人工智能作為創(chuàng)作工具帶來的革新價值,推動生成式人工智能時代著作權(quán)制度的優(yōu)化與革新。對于人工智能輔助創(chuàng)作,需要建立科學(xué)的創(chuàng)作貢獻認(rèn)定標(biāo)準(zhǔn),重點關(guān)注提示詞創(chuàng)作、內(nèi)容編輯修改和創(chuàng)作過程中的選擇判斷等體現(xiàn)人類智慧投入的關(guān)鍵環(huán)節(jié)。基于創(chuàng)作貢獻的差異性,可對具有獨創(chuàng)性的提示詞創(chuàng)作和實質(zhì)性內(nèi)容改編給予一定的著作權(quán)保護,并為其他類型的創(chuàng)作投入探索相應(yīng)的權(quán)益保護機制。最后,還應(yīng)重視AIGC產(chǎn)業(yè)鏈各主體的協(xié)同發(fā)展。通過提升訓(xùn)練數(shù)據(jù)透明度、構(gòu)建內(nèi)容溯源機制等技術(shù)支撐體系,為精細(xì)化的著作權(quán)保護和責(zé)任認(rèn)定提供保障,推動產(chǎn)業(yè)規(guī)范化發(fā)展。這一系列制度創(chuàng)新不僅將為生成式人工智能時代的內(nèi)容創(chuàng)新提供堅實保障,更將推動數(shù)字創(chuàng)意產(chǎn)業(yè)邁向新的發(fā)展高度,推動實現(xiàn)技術(shù)創(chuàng)新與文化繁榮的深度融合。
(作者分別系對外經(jīng)濟貿(mào)易大學(xué)法學(xué)院教授、博士生導(dǎo)師,對外經(jīng)濟貿(mào)易大學(xué)數(shù)字經(jīng)濟與法律創(chuàng)新研究中心助理研究員)
編輯:武卓立