直接生成16秒高清視頻我國自研視頻大模型在京發布_新聞頻道_中國青年網

<mark id="dbctz"><kbd id="dbctz"></kbd></mark>

<menu id="dbctz"></menu>

中國青年網

首頁 >> 國內 >> 正文

直接生成16秒高清視頻我國自研視頻大模型在京發布

發稿時間：2024-04-28 19:26:00 來源：新華網

　　新華社北京4月27日電（記者魏夢佳）只需一段文字指令就能生成一段逼真視頻，今年初，文生視頻大模型Sora在全球人工智能業內外引發廣泛關注。27日，2024中關村論壇年會上首次發布我國自研的具“長時長、高一致性、高動態性”特點的文生視頻大模型Vidu。

　　記者從會上獲悉，這一視頻大模型由清華大學聯合北京生數科技有限公司共同研發，可根據文本描述直接生成長達16秒、分辨率高達1080P的高清視頻內容，不僅能模擬真實物理世界，還擁有豐富想象力。

　　清華大學人工智能研究院副院長、生數科技首席科學家朱軍說，當前國內視頻大模型的生成視頻時長大多為4秒左右，Vidu則可實現一次性生成16秒的視頻時長。同時，視頻畫面能保持連貫流暢，隨著鏡頭移動，人物和場景在時間、空間中能保持高一致性。

　　在動態性方面，Vidu能生成復雜的動態鏡頭，不再局限于簡單的推、拉、移等固定鏡頭，而是能在一段畫面里實現遠景、近景、中景、特寫等不同鏡頭的切換，包括能直接生成長鏡頭、追焦、轉場等效果。

　　“Vidu能模擬真實物理世界，生成細節復雜且符合物理規律的場景，例如合理的光影效果、細膩的人物表情等，還能創造出具有深度和復雜性的超現實主義內容?！敝燔娊榻B，由于采用“一步到位”的生成方式，視頻片段從頭到尾連續生成，沒有明顯的插幀現象。

　　此外，Vidu還可生成如熊貓、龍等形象。

　　據悉，Vidu的技術突破源于團隊在機器學習和多模態大模型方面的長期積累，其核心技術架構由團隊早在2022年就提出并持續開展自主研發?！白鳛橐豢钔ㄓ靡曈X模型，我們相信，Vidu未來能支持生成更加多樣化、更長時長的視頻內容，探索不同的生成任務，其靈活架構也將兼容更廣泛的模態，進一步拓展多模態通用能力的邊界?！敝燔娬f。

責任編輯：楊逸凡

京ICP備13016345號-8 | 京公網安備 11010102004843號|24小時違法和不良信息舉報電話：010-64098588

互聯網新聞信息服務許可證10120170007號 |增值電信業務經營許可證A2.B1-20232628/京B2-20224905號|信息網絡傳播視聽節目許可證0105108號

共青團中央主辦中國青年報主管中青網新媒體科技（北京）有限公司版權所有

少妇下岗被迫献身,国产亚洲精品影视在线产品,2018国产高清在线视频,国产免费一区二区三区最新

<mark id="dbctz"><kbd id="dbctz"></kbd></mark>

<menu id="dbctz"></menu>