99色在线视频-99色综合-99视频精品全国免费-99视频全部免费-能在线观看的一区二区三区-嗯!啊!使劲用力在线观看

<samp id="ss48m"></samp>

<samp id="ss48m"><tbody id="ss48m"></tbody></samp>

<ul id="ss48m"><center id="ss48m"></center></ul>

谷歌 AI 生成視頻兩連發：720p 高清 + 長鏡頭，網友：對短視頻行業沖擊太大

人工智能

2022

10/08

11:35

量子位

分享

評論

來源：量子位

內容生成 AI 進入視頻時代！

Meta 發布「用嘴做視頻」僅一周，谷歌 CEO 劈柴哥接連派出兩名選手上場競爭。

第一位Imagen Video與 Meta 的 Make-A-Video 相比突出一個高清，能生成 1280*768 分辨率、每秒 24 幀的視頻片段。

另一位選手Phenaki，則能根據 200 個詞左右的提示語生成2 分鐘以上的長鏡頭，講述一個完整的故事。

網友看過后表示，這一切進展實在太快了。

也有網友認為，這種技術一旦成熟，會沖擊短視頻行業。

那么，兩個 AI 具體有什么能力和特點，我們分別來看。

Imagen Video：理解藝術風格與 3D 結構

Imagen Video 同樣基于最近大火的擴散模型，直接繼承自 5 月份的圖像生成 SOTA 模型 Imagen。

除了分辨率高以外，還展示出三種特別能力。

首先它能理解并生成不同藝術風格的作品，如 " 水彩畫 " 或者 " 像素畫 "，或者直接 " 梵高風格 "。

它還能理解物體的 3D 結構，在旋轉展示中不會變形。

最后它還繼承了 Imagen 準確描繪文字的能力，在此基礎上僅靠簡單描述產生各種創意動畫，

這效果，直接當成一個視頻的片頭不過分吧？

除了應用效果出色以外，研究人員表示其中用到的一些優化技巧不光對視頻生成有效，可以泛化至一般擴散模型。

具體來說，Imagen Video 是一系列模型的集合。

語言模型部分是谷歌自家的T5-XXL，訓練好后凍結住文本編碼器部分。

與負責從文本特征映射到圖像特征的 CLIP 相比，有一個關鍵不同：

語言模型只負責編碼文本特征，把文本到圖像轉換的工作丟給了后面的視頻擴散模型。

基礎模型，在生成圖像的基礎上以自回歸方式不斷預測下一幀，首先生成一個 48*24、每秒 3 幀的視頻。

接下來，一系列空間超分辨率（Spatial Super-Resolution）與時間超分辨率（Temporal Super-Resolution）模型接連對視頻做擴展處理。

所有 7 種擴散模型都使用了v-prediction parameterization方法，與傳統方法相比在視頻場景中可以避免顏色偏移。

這種方法擴展到一般擴散模型，還使樣本質量指標的收斂速度更快。

此外還有漸進式蒸餾（Progressive Distillation），將每次迭代所需的采樣步驟減半，大大節省顯存消耗。

這些優化技巧加起來，終于使生成高清視頻成為可能。

Phenaki：人人都能是 " 導演 "

Phenaki 的論文投了 ICLR 2023 會議，在一周前 Meta 發布 Make-a-video 的時候還是匿名雙盲評審狀態。

如今信息公開，原來研究團隊同樣來自谷歌。

在公開的信息中，Phenaki 展示了它交互生成視頻的能力，可以任意切換視頻的整體風格：高清視頻 / 卡通，還能夠切換任意場景。

還可以向 Phenaki 輸入一個初始幀以及一個提示，便能生成一段視頻。

這都還是開胃小菜，Phenaki 真正的大招是：講故事，它能夠生成 2 分鐘以上的長視頻，通過輸入長達 200 多個字符的系列提示來得到。

（那有了這個模型，豈不是人人都能當導演了？手動狗頭）

從文本提示到視頻，計算成本高、高質量文本視頻數據數量有限以及視頻長度可變一直以來都是此類模型發展的難題。

以往的大多數 AI 模型都是通過單一的提示來生成視頻，但若要生成一個長時間并且連貫的視頻這遠遠不夠。

而 Phenaki 則能生成 2 分鐘以上的視頻，并且還具備故事情節，這主要歸功于它能夠根據一系列的提示來生成視頻的能力。

具體來說，研究人員引入了一個新的因果模型來學習表示視頻：將視頻視作圖像的一個時間序列。

這個模型基于 transformer，可以將視頻分解成離散的小表示，而分解視頻則是按照時間的因果順序來進行的。

再講通俗一點，就是通過空間 transformer 將單個提示進行編碼，隨后再用因果 transformer 將多個編碼好的提示串聯起來。

一個提示生成一段視頻，這樣一來，視頻序列便可以沿著提示中描述的時間序列將整個 " 故事 " 串在一起。

因為將視頻壓縮為離散的圖像序列，這樣也大大減少了 AI 處理標記視頻的數量，在一定程度上降低了模型的訓練成本。

提到模型訓練，和大型圖像系統一樣，Phenaki 也主要使用文本 - 圖像數據進行訓練，此外，研究人員還用 1.4 秒，幀率 8FPS 的短視頻文本對 Phenaki 進行訓練。

僅僅通過對大量圖像文本對以及少量視頻文本例子進行聯合訓練，便能達到突破視頻數據集的效果。

Imagen Video 和 Phenaki，谷歌接連放出大招，從文本到視頻的 AI 發展勢頭迅猛。

值得一提的是，Imagen Video 一作表示，兩個團隊將合作進行下一步研究。

嗯，有的網友已經等不及了。

One More Thing

出于安全和倫理的考慮，谷歌暫時不會發布兩個視頻生成模型的代碼或 Demo。

不過既然發了論文，出現開源復刻版本也只是時間問題。

畢竟當初 Imagen 論文出來沒幾個月，GitHub 上就出現了 Pytorch 版本。

另外 Stable Diffusion 背后的 StabilityAI 創始人兼 CEO 也說過，將發布比 Meta 的 Make-A-Video 更好的模型，而且是大家都能用上的那種。

當然，每次 AI 有了新進展后都會不可避免地碰到那個話題—— AI 會不會取代人類。

目前來說，一位影視行業的工作者表示還不到時候：

老實說，作為一個在電影行業工作了十年的人，這個話題令人沮喪。

在他看來，當前的視頻生成 AI 在外行看起來已經足夠驚艷，不過業內人士會認為 AI 還缺乏對每一個鏡頭的精細控制。

對于這個話題，StabilityAI 新任首席信息官 Daniel Jeffries 此前撰文表示，AI 最終會帶來更多的工作崗位。

如相機的發明雖然取代了大部分肖像畫家，但也創造了攝影師，還開辟了電影和電視這樣的全新產業。

5 年后再回看的話，反對 AI 就像現在反對 Photoshop 一樣奇怪，AI 只不過是另一個工具。

Jeffries 稱未來是環境人工智能（Ambient AI）的時代，各個行業、各個領域都會在人工智能的加持下進行發展。

不過現在我們需要的是一個更開放的人工智能環境，也就是說：開源！

THE END

廣告、內容合作請點擊這里尋求合作

ai

免責聲明：本文系轉載，版權歸原作者所有；旨在傳遞信息，不代表砍柴網的觀點和立場。

相關熱點

Meta AI大佬：目前大多數AI方法永遠不會帶來真正智

9月26日消息，Facebook母公司Meta的首席AI科學家雅恩·勒昆(Yann LeCun)認為，目前大多數AI方法永遠不會帶來真正的智能，他對當今深度學習領域許多最成功的研究方法持懷疑態度。

業界

端側邊緣側AI的芯未來

沉浸式全息影像、虛擬數字人員工、數字藏品、虛擬營業廳、城市數字孿生、超寫實數字人......

業界

高通推出全新 AI 軟件棧產品組合，讓 AI 部署更輕松

6 月 22 日消息，高通技術公司今日宣布推出高通 AI 軟件棧產品組合，以提升高通在 AI 和智能網聯邊緣領域的領先優勢。

業界

Spotify擬收購 AI 語音平臺 Sonantic

據財聯社消息，音樂軟件Spotify發布聲明稱，將收購AI語音平臺Sonantic。聲明指出“我們已確定在我們的平臺上進行文字轉語音功能的數個潛在的機會。

業界

AI大時代下的創新，追一科技發布RoFormerV2模型

最近，追一科技發布了RoFormerV2模型，憑借追一獨創的旋轉位置編碼技術（RoPE），全面超越了BERT、RoBERTa、Albert、Electra等當前的主流預訓練模型。

業界

最新文章

相關推薦

“特斯拉又割了我 7 萬塊”

用 eSIM 取代手機卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級新功能”？網友：炒華為冷飯！

谷歌Pixel 6真機曝光：最美安卓屏幕沒跑了！

iPhone 13機模曝光：值得等！

蘋果計劃在美國生產 Apple Car 汽車電池

砍柴網（ikanchai.com）創立于2013年，始終秉承觀點獨到、全面深入、有料有趣的宗旨，在科技與人文之間尋找商業新價值。

關于我們 | 聯系我們 | 商務合作 | 尋求報道 | 投稿須知

意見反饋：kefu@ikanchai.com

稿件投訴：post@ikanchai.com

內容合作QQ：1587015870

商務合作：bd@ikanchai.com

關注我們

關注砍柴網官方微博
每日獲取最新科技動態

關注砍柴網微信公眾號
探索科技與商業的邏輯

商務合作、媒體邀約
趕緊聯系我們

Copyright ? 2013-2020 砍柴網 / 京ICP備15042874號-1 / 京公網安備 11010502032797號 / 本站由CMSTOP、阿里云、億速云、騰訊云提供驅動力

主站蜘蛛池模板：久久精品国产免费中文 | 狠狠色狠狠色综合久久第一次 | 国产在线一区二区三区四区 | 99精品视频99 | 欧美成人午夜视频在线观看 | 噜噜噜狠狠夜夜躁 | 色黄污在线看黄污免费看黄污 | 久久精品国产一区二区三区日韩 | 天天拍夜夜添久久精品中文 | 特黄特级高清免费视频毛片 | 日本免费福利视频 | 久久精品欧美一区二区 | 制服丝袜视频在线观看 | 狠狠夜色午夜久久综合热91 | 国产精品h片在线播放 | 极品精品国产超清自在线观看 | 久操久操久操 | 日日久 | 天天摸天天碰中文字幕 | 在线黄网站 | 日韩福利一区 | 美国aaaa一级毛片啊 | 亚洲精品另类有吗中文字幕 | 午夜看片网址 | 免费黄色福利视频 | 三级网站视频 | 一本大道在线观看 | 在线看www免费看 | 日日碰夜夜操 | 中国一级做a爱片免费 | 国产亚洲精品激情都市 | 欧美首页 | 欧美一区二区三区男人的天堂 | 一级毛片在线播放 | 好吊爽在线播放视频 | 在线播放国产麻豆 | 亚洲欧美在线免费 | 99er精品| 日韩视频在线免费观看 | 亚洲欧洲日产v特级毛片 | a黄色|

<samp id="oigwo"><tfoot id="oigwo"></tfoot></samp>

<th id="oigwo"></th>

<th id="oigwo"></th>