YouTube首席執(zhí)行官尼爾·莫漢(Neal Mohan)近日在接受媒體采訪時(shí),就OpenAI旗下文本生成視頻AI模型Sora的訓(xùn)練數(shù)據(jù)問題發(fā)表看法。莫漢雖然沒有直接證據(jù)表明OpenAI使用了YouTube視頻進(jìn)行模型訓(xùn)練,但他明確指出,這種行為若屬實(shí),將違反YouTube的現(xiàn)行平臺(tái)服務(wù)條款。
莫漢強(qiáng)調(diào),創(chuàng)作者在YouTube平臺(tái)上上傳視頻時(shí),享有特定的權(quán)益和期望,其中包括對視頻內(nèi)容的合理使用和保護(hù)。根據(jù)YouTube的服務(wù)條款,未經(jīng)授權(quán)下載視頻或視頻片段用于其他目的,尤其是用于訓(xùn)練AI模型,是明確禁止的。莫漢進(jìn)一步表示,這種違規(guī)行為違背了創(chuàng)作者與YouTube之間建立的服務(wù)協(xié)議和信任關(guān)系。
值得注意的是,雖然莫漢對OpenAI的行為表示擔(dān)憂,但他也承認(rèn)了YouTube的母公司谷歌在培訓(xùn)自家AI模型Gemini時(shí)使用了YouTube上的內(nèi)容。他強(qiáng)調(diào),谷歌在使用這些內(nèi)容之前,已經(jīng)獲得了創(chuàng)作者的授權(quán),并嚴(yán)格遵守了與創(chuàng)作者之間的合同協(xié)議。這一表態(tài)似乎也在暗示OpenAI在利用YouTube視頻進(jìn)行模型訓(xùn)練時(shí),并未遵循類似的授權(quán)和合規(guī)流程。
OpenAI方面對于Sora模型的訓(xùn)練數(shù)據(jù)來源一直保持較為模糊的態(tài)度。公司首席技術(shù)官M(fèi)ira Murati在接受采訪時(shí),對于是否使用了YouTube視頻作為訓(xùn)練數(shù)據(jù)的問題并未給出明確答復(fù),只是表示如果視頻是公開可用且合法的,那么可能會(huì)被納入訓(xùn)練集,但她本人對此并不確定。
此次事件引發(fā)了關(guān)于AI模型訓(xùn)練數(shù)據(jù)使用合規(guī)性的廣泛討論。隨著人工智能技術(shù)的快速發(fā)展,AI模型的訓(xùn)練數(shù)據(jù)來源和使用方式成為業(yè)界關(guān)注的焦點(diǎn)。如何確保訓(xùn)練數(shù)據(jù)的合法性、尊重創(chuàng)作者權(quán)益,以及遵循相關(guān)法規(guī)和行業(yè)規(guī)范,將是未來AI技術(shù)發(fā)展面臨的重要挑戰(zhàn)。
YouTube作為全球最大的視頻分享平臺(tái)之一,其對于內(nèi)容版權(quán)和數(shù)據(jù)使用的態(tài)度具有廣泛的影響力。莫漢的表態(tài)無疑向業(yè)界傳遞了一個(gè)明確的信息:任何未經(jīng)授權(quán)使用YouTube視頻進(jìn)行AI模型訓(xùn)練的行為,都將受到平臺(tái)的嚴(yán)厲打擊。
對于OpenAI而言,如何在追求技術(shù)創(chuàng)新的同時(shí),確保合規(guī)使用訓(xùn)練數(shù)據(jù),將是其未來發(fā)展中需要認(rèn)真考慮的問題。同時(shí),這也提醒了其他AI企業(yè)和研究機(jī)構(gòu),在利用公開數(shù)據(jù)進(jìn)行模型訓(xùn)練時(shí),必須尊重原始數(shù)據(jù)的版權(quán)和隱私,遵循相關(guān)法規(guī)和行業(yè)規(guī)范,以實(shí)現(xiàn)可持續(xù)和負(fù)責(zé)任的AI發(fā)展。
原創(chuàng)文章,作者:聆聽,如若轉(zhuǎn)載,請注明出處:http://m.rponds.cn/article/643793.html