一、AIGC版權(quán)歸屬法律爭(zhēng)議與確權(quán)機(jī)制
1.人工智能生成物的作品屬性界定
在判定人工智能生成物是否屬于作品時(shí),獨(dú)創(chuàng)性是關(guān)鍵的判斷標(biāo)準(zhǔn)。然而,這一標(biāo)準(zhǔn)在司法實(shí)踐中存在諸多爭(zhēng)議。從我國(guó)現(xiàn)行著作權(quán)法來(lái)看,作品需是文學(xué)、藝術(shù)和科學(xué)領(lǐng)域內(nèi)具有獨(dú)創(chuàng)性并能以一定形式表現(xiàn)的智力成果。對(duì)于人工智能生成內(nèi)容,部分具有人類(lèi)作品的外觀(guān),若不加以提示,難以準(zhǔn)確區(qū)分是人類(lèi)創(chuàng)作還是人工智能生成。此時(shí),就需要深入考察人工智能創(chuàng)作過(guò)程是否體現(xiàn)了人類(lèi)的智慧貢獻(xiàn)。
以我國(guó)蘇州市中級(jí)人民法院在“豐某訴東山公司侵害著作權(quán)及不正當(dāng)競(jìng)爭(zhēng)案”為例,用戶(hù)首次輸入提示詞由人工智能繪圖軟件自動(dòng)生成的內(nèi)容,不被認(rèn)定構(gòu)成作品;但如果用戶(hù)通過(guò)增加提示詞、修改參數(shù)等對(duì)最初生成的圖片進(jìn)行調(diào)整、選擇和潤(rùn)色,對(duì)圖片的布局、比例、視角、構(gòu)圖要素、色彩、線(xiàn)條等表達(dá)要素做出了個(gè)性化選擇和實(shí)質(zhì)性貢獻(xiàn),則滿(mǎn)足作品的獨(dú)創(chuàng)性要件。
國(guó)際上,不同國(guó)家對(duì)此觀(guān)點(diǎn)和做法各異。美國(guó)版權(quán)局堅(jiān)持作品必須是人類(lèi)創(chuàng)作的,必須體現(xiàn)人的創(chuàng)造性,否則排除其作品資格和著作權(quán)保護(hù)。而相對(duì)而言,我國(guó)司法界和學(xué)術(shù)界更加開(kāi)放,不少法院已經(jīng)判決人工智能生成內(nèi)容體現(xiàn)了使用者的創(chuàng)造性,基于作品資格并進(jìn)行著作權(quán)保護(hù)。在歐洲,對(duì)于人工智能生成物的著作權(quán)歸屬也在不斷探討和研究中,尚未形成統(tǒng)一的定論。
2.訓(xùn)練數(shù)據(jù)來(lái)源合法性風(fēng)險(xiǎn)
- 知識(shí)產(chǎn)權(quán)侵權(quán)隱患:AIGC技術(shù)在數(shù)據(jù)采集中存在諸多知識(shí)產(chǎn)權(quán)侵權(quán)風(fēng)險(xiǎn)。例如,未經(jīng)允許采集他人作品用于訓(xùn)練,存在著作權(quán)侵權(quán)風(fēng)險(xiǎn)。像LAION – 5B數(shù)據(jù)集爭(zhēng)議,該數(shù)據(jù)集在收集過(guò)程中可能未經(jīng)授權(quán)使用了大量受版權(quán)保護(hù)的圖像,引發(fā)了廣泛的版權(quán)爭(zhēng)議。利用爬蟲(chóng)協(xié)議等底層技術(shù)繞開(kāi)第三方設(shè)置的訪(fǎng)問(wèn)限制或?qū)徍艘髮?duì)數(shù)據(jù)進(jìn)行搜索抓取,有非法獲取計(jì)算機(jī)信息系統(tǒng)數(shù)據(jù)、侵犯?jìng)€(gè)人信息或商業(yè)秘密的風(fēng)險(xiǎn)。三星代碼泄露事件就是一個(gè)典型案例,代碼的非法獲取和使用可能涉及到商業(yè)秘密的侵犯。
- 生物特征數(shù)據(jù)合規(guī)問(wèn)題:未經(jīng)允許采集和使用他人聲音、面部特征等生物識(shí)別數(shù)據(jù),存在人格權(quán)侵權(quán)風(fēng)險(xiǎn)。企業(yè)在使用生物特征數(shù)據(jù)進(jìn)行訓(xùn)練時(shí),必須嚴(yán)格遵守相關(guān)法律法規(guī),確保數(shù)據(jù)來(lái)源的合法性和合規(guī)性。
3.企業(yè)版權(quán)合規(guī)實(shí)踐路徑
企業(yè)要做好版權(quán)合規(guī),首先應(yīng)建設(shè)數(shù)據(jù)源合法性審查機(jī)制。依據(jù)《生成式人工智能服務(wù)安全基本要求》,企業(yè)在模型訓(xùn)練和內(nèi)容生成過(guò)程中,要使用具有合法來(lái)源的數(shù)據(jù)和基礎(chǔ)模型。可以設(shè)計(jì)語(yǔ)料授權(quán)協(xié)議,明確數(shù)據(jù)提供者和使用者的權(quán)利義務(wù),確保數(shù)據(jù)的使用獲得合法授權(quán)。
同時(shí),應(yīng)用區(qū)塊鏈溯源技術(shù),對(duì)數(shù)據(jù)的來(lái)源、使用和流轉(zhuǎn)進(jìn)行全程記錄,實(shí)現(xiàn)數(shù)據(jù)的可追溯性,有效防范版權(quán)侵權(quán)風(fēng)險(xiǎn)。例如,通過(guò)區(qū)塊鏈技術(shù)記錄每一次數(shù)據(jù)的采集、處理和使用情況,一旦出現(xiàn)版權(quán)糾紛,可以快速準(zhǔn)確地查明數(shù)據(jù)的來(lái)源和使用情況。
此外,還應(yīng)推動(dòng)標(biāo)注規(guī)則的標(biāo)準(zhǔn)化。對(duì)生成或者編輯的信息內(nèi)容在合理位置、區(qū)域進(jìn)行顯著標(biāo)識(shí),明確內(nèi)容的生成方式和來(lái)源,做到有效防范企業(yè)的知識(shí)產(chǎn)權(quán)侵權(quán)風(fēng)險(xiǎn)。通過(guò)標(biāo)準(zhǔn)化的標(biāo)注規(guī)則,不僅可以提高企業(yè)的合規(guī)性,也有助于用戶(hù)更好地識(shí)別和使用AIGC生成的內(nèi)容。
二、虛假信息生成的技術(shù)防控體系
1.深度偽造內(nèi)容特征識(shí)別
深度偽造內(nèi)容的特征識(shí)別依賴(lài)多模態(tài)檢測(cè)算法,其原理是綜合分析文本、圖像、音頻和視頻等多種模態(tài)的數(shù)據(jù)特征。通過(guò)對(duì)不同模態(tài)數(shù)據(jù)的特征提取和比對(duì),算法能夠發(fā)現(xiàn)深度偽造內(nèi)容中的異常和不一致之處。例如,在視頻中,眨眼頻率的異常可能暗示著視頻被篡改;音頻頻譜的異常則可能表明音頻經(jīng)過(guò)了處理。
NIST對(duì)抗測(cè)試平臺(tái)在這一過(guò)程中發(fā)揮著重要作用。該平臺(tái)通過(guò)模擬各種攻擊場(chǎng)景,對(duì)檢測(cè)算法進(jìn)行評(píng)估和優(yōu)化。它會(huì)生成一系列具有挑戰(zhàn)性的測(cè)試樣本,包括不同類(lèi)型和程度的深度偽造內(nèi)容,以檢驗(yàn)檢測(cè)算法的性能和魯棒性。通過(guò)不斷地在NIST對(duì)抗測(cè)試平臺(tái)上進(jìn)行測(cè)試和改進(jìn),檢測(cè)算法能夠更好地適應(yīng)復(fù)雜多變的深度偽造技術(shù),提高對(duì)虛假信息的識(shí)別能力。
2.虛假信息傳播阻斷機(jī)制
- 技術(shù)協(xié)同應(yīng)用:區(qū)塊鏈溯源與數(shù)字水印技術(shù)的協(xié)同應(yīng)用是阻斷虛假信息傳播的關(guān)鍵。區(qū)塊鏈技術(shù)可以記錄信息的來(lái)源和傳播路徑,實(shí)現(xiàn)信息的可追溯性。數(shù)字水印技術(shù)則可以在信息中嵌入特定的標(biāo)識(shí),用于驗(yàn)證信息的真實(shí)性和完整性。通過(guò)這兩種技術(shù)的結(jié)合,能夠有效追蹤虛假信息的源頭,并在傳播過(guò)程中及時(shí)發(fā)現(xiàn)和攔截。
- 標(biāo)注規(guī)范遵循:依據(jù)《人工智能生成合成內(nèi)容標(biāo)識(shí)辦法》,對(duì)生成的內(nèi)容進(jìn)行明確標(biāo)注,表明其是否為人工智能生成或合成。這有助于用戶(hù)識(shí)別虛假信息,同時(shí)也為平臺(tái)的審核和管理提供了依據(jù)。
- 平臺(tái)響應(yīng)流程:平臺(tái)在發(fā)現(xiàn)虛假信息后,應(yīng)立即啟動(dòng)響應(yīng)機(jī)制。首先,對(duì)虛假信息進(jìn)行快速定位和分析,確定其傳播范圍和影響程度。然后,采取相應(yīng)的措施,如刪除虛假信息、限制相關(guān)賬號(hào)的傳播權(quán)限等。最后,對(duì)事件進(jìn)行總結(jié)和評(píng)估,不斷完善防控機(jī)制。平臺(tái)應(yīng)在規(guī)定的時(shí)效內(nèi)完成這些操作,以確保虛假信息得到及時(shí)有效的處理。
3.用戶(hù)依賴(lài)度管理策略
防沉迷系統(tǒng)設(shè)計(jì)是管理用戶(hù)對(duì)AIGC依賴(lài)度的關(guān)鍵。首先,可通過(guò)輸入頻次控制,限制用戶(hù)在一定時(shí)間內(nèi)的提問(wèn)次數(shù),避免過(guò)度依賴(lài)。例如,設(shè)定每小時(shí)最多提問(wèn)10次,防止用戶(hù)無(wú)節(jié)制地使用。其次,對(duì)生成內(nèi)容進(jìn)行可信度分級(jí)提示,讓用戶(hù)了解內(nèi)容的可靠程度。對(duì)于可信度較低的內(nèi)容,給予明顯的警示,引導(dǎo)用戶(hù)理性對(duì)待。
在未成年人保護(hù)方面,應(yīng)設(shè)置專(zhuān)門(mén)的保護(hù)機(jī)制。例如,對(duì)未成年人的輸入內(nèi)容進(jìn)行嚴(yán)格審核,過(guò)濾不適當(dāng)?shù)男畔?。同時(shí),限制未成年人使用AIGC的時(shí)間和功能,避免對(duì)其身心健康造成不良影響。
以ChatGPT歷史對(duì)話(huà)泄漏案例為鑒,企業(yè)應(yīng)加強(qiáng)對(duì)用戶(hù)信息的保護(hù),防止用戶(hù)數(shù)據(jù)的泄露和濫用。通過(guò)完善的安全措施,保障用戶(hù)的隱私和權(quán)益,增強(qiáng)用戶(hù)對(duì)AIGC的信任。
三、生成式AI倫理治理框架構(gòu)建
1.算法歧視消除機(jī)制
算法歧視是生成式AI面臨的重要倫理問(wèn)題,消除算法歧視需從訓(xùn)練數(shù)據(jù)去偏處理技術(shù)入手。訓(xùn)練數(shù)據(jù)中的偏差可能導(dǎo)致AI在輸出結(jié)果時(shí)產(chǎn)生職業(yè)、地域、性別等方面的歧視。例如,若訓(xùn)練數(shù)據(jù)中某一職業(yè)的樣本多為男性,AI可能在推薦該職業(yè)相關(guān)內(nèi)容時(shí)更傾向于男性。
為解決這一問(wèn)題,企業(yè)可采用訓(xùn)練數(shù)據(jù)去偏處理技術(shù),對(duì)數(shù)據(jù)進(jìn)行篩選和調(diào)整,去除可能導(dǎo)致歧視的因素。同時(shí),制定人工標(biāo)注規(guī)則至關(guān)重要。標(biāo)注人員需遵循嚴(yán)格的規(guī)范,確保標(biāo)注過(guò)程的客觀(guān)性和公正性。標(biāo)注完成后,還需進(jìn)行核驗(yàn)流程,對(duì)標(biāo)注結(jié)果進(jìn)行復(fù)查和修正,保證數(shù)據(jù)的準(zhǔn)確性。
依據(jù)《管理辦法》第四條規(guī)定,利用生成式人工智能生成的內(nèi)容應(yīng)當(dāng)真實(shí)準(zhǔn)確,采取措施防止生成虛假信息。這也要求在消除算法歧視時(shí),確保AI生成的內(nèi)容不包含歧視性信息,做到公平公正。通過(guò)這些措施,可有效減少算法歧視的發(fā)生,使生成式AI更加符合倫理規(guī)范。
2.隱私保護(hù)雙重路徑
隱私保護(hù)是生成式AI倫理治理的關(guān)鍵環(huán)節(jié),可通過(guò)輸入信息脫敏與使用記錄保護(hù)雙重路徑來(lái)實(shí)現(xiàn)。輸入信息脫敏是指對(duì)用戶(hù)輸入的敏感信息進(jìn)行處理,如對(duì)姓名、身份證號(hào)等進(jìn)行加密或替換,防止信息泄露。使用記錄保護(hù)則是對(duì)用戶(hù)與AI交互的記錄進(jìn)行妥善保存和管理,避免被非法獲取和利用。
對(duì)于生物特征數(shù)據(jù),有特殊的規(guī)范要求。依據(jù)《個(gè)人信息保護(hù)法》,企業(yè)在收集、使用和存儲(chǔ)生物特征數(shù)據(jù)時(shí),需獲得用戶(hù)明確的授權(quán),并采取嚴(yán)格的安全措施。動(dòng)態(tài)數(shù)據(jù)加密存儲(chǔ)方案是一種有效的保護(hù)方式,它在數(shù)據(jù)傳輸和存儲(chǔ)過(guò)程中進(jìn)行加密,且加密密鑰會(huì)動(dòng)態(tài)變化,即使數(shù)據(jù)被竊取,攻擊者也難以解密。通過(guò)這些措施,可確保用戶(hù)的隱私得到充分保護(hù),增強(qiáng)用戶(hù)對(duì)生成式AI的信任。
3.科技倫理審查制度
企業(yè)倫理委員會(huì)的組建是科技倫理審查制度的核心。其組建標(biāo)準(zhǔn)應(yīng)涵蓋多方面,成員需包括技術(shù)專(zhuān)家、倫理學(xué)家、法律專(zhuān)家等,以確保從不同角度對(duì)生成式AI的研發(fā)和應(yīng)用進(jìn)行審查。倫理委員會(huì)應(yīng)制定詳細(xì)的審查流程和標(biāo)準(zhǔn),對(duì)AI項(xiàng)目的各個(gè)環(huán)節(jié)進(jìn)行評(píng)估,包括數(shù)據(jù)使用、算法設(shè)計(jì)、應(yīng)用場(chǎng)景等。
第三方認(rèn)證機(jī)制可作為企業(yè)倫理審查的補(bǔ)充。專(zhuān)業(yè)的第三方機(jī)構(gòu)具有更廣泛的行業(yè)經(jīng)驗(yàn)和專(zhuān)業(yè)知識(shí),能夠提供客觀(guān)、公正的評(píng)估意見(jiàn)。例如,與NCMEC合作,引入其CSAM檢測(cè)系統(tǒng),可有效檢測(cè)AI生成內(nèi)容中是否包含兒童性虐待材料,保障內(nèi)容的安全性。
RLHF價(jià)值觀(guān)對(duì)齊也是重要實(shí)踐。通過(guò)強(qiáng)化學(xué)習(xí)從人類(lèi)反饋中學(xué)習(xí),使AI的輸出符合人類(lèi)的價(jià)值觀(guān)和倫理標(biāo)準(zhǔn)。企業(yè)應(yīng)建立完善的價(jià)值觀(guān)評(píng)估體系,對(duì)AI的輸出進(jìn)行持續(xù)監(jiān)測(cè)和調(diào)整。通過(guò)科技倫理審查制度的建設(shè),可確保生成式AI在符合倫理規(guī)范的前提下健康發(fā)展。
四、企業(yè)部署AIGC合規(guī)檢查清單
1.數(shù)據(jù)治理合規(guī)要點(diǎn)
- 語(yǔ)料授權(quán)文件清單:包括數(shù)據(jù)提供者的授權(quán)書(shū)、知識(shí)產(chǎn)權(quán)聲明模板、數(shù)據(jù)使用許可協(xié)議等,確保數(shù)據(jù)來(lái)源合法合規(guī)。知識(shí)產(chǎn)權(quán)聲明模板應(yīng)明確數(shù)據(jù)的知識(shí)產(chǎn)權(quán)歸屬、使用范圍和限制等內(nèi)容。
- 個(gè)人信息影響評(píng)估表:對(duì)涉及個(gè)人信息的數(shù)據(jù)進(jìn)行評(píng)估,包括信息收集目的、處理方式、安全保障措施等,以滿(mǎn)足《個(gè)人信息保護(hù)法》的要求。
- 數(shù)據(jù)出境審批流程:若涉及數(shù)據(jù)出境,需按照相關(guān)規(guī)定進(jìn)行審批,提交數(shù)據(jù)出境風(fēng)險(xiǎn)評(píng)估報(bào)告等文件,確保數(shù)據(jù)出境安全。
2.算法備案操作指南
- 第一階段(第1 – 1個(gè)月):依據(jù)《互聯(lián)網(wǎng)信息服務(wù)算法推薦管理規(guī)定》,企業(yè)需準(zhǔn)備算法備案所需材料,包括算法的基本信息、功能描述、運(yùn)行機(jī)制等。同時(shí),確定備案系統(tǒng)的填報(bào)賬號(hào)和密碼,完成注冊(cè)和登錄。
- 第二階段(第2 – 2個(gè)月):在備案系統(tǒng)中詳細(xì)填報(bào)算法信息,確保信息準(zhǔn)確無(wú)誤。對(duì)算法的設(shè)計(jì)原理、數(shù)據(jù)來(lái)源、模型訓(xùn)練等關(guān)鍵環(huán)節(jié)進(jìn)行說(shuō)明。若在填報(bào)過(guò)程中發(fā)現(xiàn)信息變更,需及時(shí)修改并重新提交。
- 第三階段(第3 – 3個(gè)月):提交備案申請(qǐng)后,等待審核結(jié)果。若審核不通過(guò),按照反饋意見(jiàn)進(jìn)行整改并重新提交。變更備案觸發(fā)條件包括算法功能重大調(diào)整、數(shù)據(jù)來(lái)源發(fā)生變化等,出現(xiàn)這些情況時(shí)需及時(shí)辦理變更備案。
3.內(nèi)容安全審核標(biāo)準(zhǔn)
- 九類(lèi)違禁內(nèi)容識(shí)別規(guī)則:依據(jù)《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》,制定包括反對(duì)憲法所確定的基本原則、危害國(guó)家安全、損害國(guó)家榮譽(yù)和利益等九類(lèi)違禁內(nèi)容的識(shí)別規(guī)則。建立意識(shí)形態(tài)關(guān)鍵詞庫(kù),對(duì)涉及敏感話(huà)題和不良思想的內(nèi)容進(jìn)行精準(zhǔn)識(shí)別。
- 虛假信息復(fù)核流程:當(dāng)發(fā)現(xiàn)疑似虛假信息時(shí),啟動(dòng)復(fù)核流程。首先對(duì)信息來(lái)源進(jìn)行核實(shí),檢查信息的真實(shí)性和可靠性。然后組織專(zhuān)業(yè)人員進(jìn)行評(píng)估,判斷信息是否屬于虛假信息。若確定為虛假信息,及時(shí)采取刪除、屏蔽等措施。
- 用戶(hù)舉報(bào)處理時(shí)效:規(guī)范用戶(hù)舉報(bào)處理時(shí)效,在收到舉報(bào)后24小時(shí)內(nèi)進(jìn)行初步核實(shí),對(duì)于情況屬實(shí)的舉報(bào),在48小時(shí)內(nèi)完成處理,并向用戶(hù)反饋處理結(jié)果。通過(guò)完善的內(nèi)容安全審核標(biāo)準(zhǔn),確保AIGC生成內(nèi)容的合法性和健康性。