上傳照片能模仿本人聲音中國AI模型引侵權爭議

2026/02/13

中國科技巨頭字節跳動近日推出人工智慧（AI）影片生成模型Seedance 2.0，引發熱議。知名中國影音創作者「影視颶風」創辦人潘天鴻實測發現，這款AI竟然在未經授權的情況下，光憑一張面部圖像，就能生成與本人高度匹配的聲音特徵。

於2月低調上線的Seedance 2.0可同步生成影片與聲音，只需輸入指令或上傳參考圖，就能在60秒內產出帶完整原生音軌的多鏡頭影片，功能強大引發討論。

Seedance 2.0被爆2大恐怖

然而，中國科技自媒體「影視颶風」在YouTube上傳一支影片表示，試用Seedance 2.0後所發現的「恐怖」之處。

首先，潘天鴻表示，他把自己的照片上傳到Seedance 2.0後，生成的影片就自動為這張臉配上他的聲音，「這個AI它會自動用我的聲音說話」。但他沒有提供聲音文件，指令中也沒有透露他的身分資訊，甚至沒有告訴系統，照片對應的人是誰，「但AI竟然知道這張臉的聲音是我的這個聲音」。

再來，潘天鴻還發現，他上傳一張帶有公司部分場景的全身照，但Seedance 2.0生成的影片，竟能以人物為中心進行運鏡，轉向大樓的另一面，而且與現實場景幾乎一模一樣。

「這不恐怖嗎？它（指AI）知道我背後的東西是什麼，即便我沒有告訴它。」潘天鴻認為，Seedance 2.0大量使用他們公司的影片進行訓練，但卻沒有對相關素材申請授權，也沒有字節跳動的工作人員聯繫他進行版權申請。

潘天鴻也提醒，當一個人上傳到網絡的資訊進入AI數據集，並且AI能百分之百模擬出一個人的任何形態以及聲音，「那請問這樣的內容，你的家人分得出真假嗎？」

影片下方網友留言表示，「現在除了比誰錢多買晶片，就是比誰道德底線更低、盜用更多東西訓練模型。」「AI最終不是技術問題，而是道德和侵權問題。」

面對相關爭議，中國媒體《中國經營報》稱，字節跳動已於9日暫停支持用戶上傳真人圖片或影片作為主體參考，並限制僅在完成活體認證後方可生成真人形象影片，同時對名人、知名IP的影片生成進行嚴格審核。

陽明交大資工系終身講座教授林一平接受大紀元採訪時坦言，這類技術真的非常厲害，是多種AI能力整合的結果，包括語音合成、聲紋辨識、少樣本學習、影像辨識與場景推測等。只要網絡上已有公開影片與聲音資料，系統便可透過爬蟲抓取並建立聲音模型，再輸入任意文字生成近似本人語音。

「如果是網紅，公開影片本來就很多，AI學習並不困難。」林一平表示，這與人類模仿他人聲音的原理類似，只是機器模仿的精準度遠高於人類。…

若您有智權相關新聞，也歡迎透過email連繫。