
2026/02/13
圖文引用自:www.epochtimes.com
中國科技巨頭字節跳動近日推出人工智慧(AI)影片生成模型Seedance 2.0,引發熱議。知名中國影音創作者「影視颶風」創辦人潘天鴻實測發現,這款AI竟然在未經授權的情況下,光憑一張面部圖像,就能生成與本人高度匹配的聲音特徵。
於2月低調上線的Seedance 2.0可同步生成影片與聲音,只需輸入指令或上傳參考圖,就能在60秒內產出帶完整原生音軌的多鏡頭影片,功能強大引發討論。
然而,中國科技自媒體「影視颶風」在YouTube上傳一支影片表示,試用Seedance 2.0後所發現的「恐怖」之處。
首先,潘天鴻表示,他把自己的照片上傳到Seedance 2.0後,生成的影片就自動為這張臉配上他的聲音,「這個AI它會自動用我的聲音說話」。但他沒有提供聲音文件,指令中也沒有透露他的身分資訊,甚至沒有告訴系統,照片對應的人是誰,「但AI竟然知道這張臉的聲音是我的這個聲音」。
再來,潘天鴻還發現,他上傳一張帶有公司部分場景的全身照,但Seedance 2.0生成的影片,竟能以人物為中心進行運鏡,轉向大樓的另一面,而且與現實場景幾乎一模一樣。
「這不恐怖嗎?它(指AI)知道我背後的東西是什麼,即便我沒有告訴它。」潘天鴻認為,Seedance 2.0大量使用他們公司的影片進行訓練,但卻沒有對相關素材申請授權,也沒有字節跳動的工作人員聯繫他進行版權申請。
潘天鴻也提醒,當一個人上傳到網絡的資訊進入AI數據集,並且AI能百分之百模擬出一個人的任何形態以及聲音,「那請問這樣的內容,你的家人分得出真假嗎?」
影片下方網友留言表示,「現在除了比誰錢多買晶片,就是比誰道德底線更低、盜用更多東西訓練模型。」「AI最終不是技術問題,而是道德和侵權問題。」
面對相關爭議,中國媒體《中國經營報》稱,字節跳動已於9日暫停支持用戶上傳真人圖片或影片作為主體參考,並限制僅在完成活體認證後方可生成真人形象影片,同時對名人、知名IP的影片生成進行嚴格審核。
陽明交大資工系終身講座教授林一平接受大紀元採訪時坦言,這類技術真的非常厲害,是多種AI能力整合的結果,包括語音合成、聲紋辨識、少樣本學習、影像辨識與場景推測等。只要網絡上已有公開影片與聲音資料,系統便可透過爬蟲抓取並建立聲音模型,再輸入任意文字生成近似本人語音。
「如果是網紅,公開影片本來就很多,AI學習並不困難。」林一平表示,這與人類模仿他人聲音的原理類似,只是機器模仿的精準度遠高於人類。…