前沿AI科技,現(xiàn)在已經(jīng)被用在了奧運會上。并且背后提供支持的,是中國科技力量。
就在巴黎奧運會比賽日正式開始,逐漸點燃觀眾激情的同時,一支“奧運8分鐘”短片也受到關注。
不僅國際奧委會主席巴赫力推:“感謝中國AI科技,讓這些女性在體育運動中的成就煥發(fā)新的色彩。”
網(wǎng)友們也紛紛點贊:
AI技術以現(xiàn)代的清晰度將歷史時刻帶入當下生活。
短片名為《永不失色的她》(To the Greatness of HER),由阿里巴巴和國際奧委會聯(lián)合推出。
百年奧運史上偉大女性的影響故事在此被濃縮在寶貴的8分鐘里,旨在致敬一代又一代在奧運賽場上不斷實現(xiàn)從0到1、不斷突破和拼搏的女運動員們。
值得關注的是,這支8分鐘短片不僅用上AI為歷史時刻重賦色彩,其中還有大模型、AIGC技術的加持。
永不失色的她
不少朋友可能已經(jīng)關注到了,奧運時隔100年再次在巴黎召開,其中一個明顯的變化是,100年前奧運項目罕有女運動員參與,而在2024年巴黎奧運會上,男女運動員比例首次達到了1:1。
而另一個顯著的改變是,這也是首屆廣泛應用AI技術的奧運會。
△阿里云AI增強視頻
阿里云和國際奧委會攜手,希望用第二重變化帶來的技術變革,向公眾展現(xiàn)更多推動了第一重變化的女運動員們歷史上珍貴的賽場時刻。
比如蘇珊·朗格倫(Suzanne Lenglen),女子網(wǎng)球史上偉大的運動員之一。
1921到1926年間,蘇珊·朗格倫保持了長達5年的世界第一。
而在傲人的賽場成績之外,蘇珊還是第一個打破女子網(wǎng)球運動服裝保守規(guī)定的人——
改長袖為短袖,改長裙為過膝百褶裙,把網(wǎng)球裙的重量從18公斤改到了0.18公斤。
可以說,是從她開始,網(wǎng)球女運動員們得以掙脫服裝的束縛,在賽場上盡情發(fā)揮。
又比如首位奧運男女混合雙向飛碟女子冠軍張山。
在1992年之前,女子雙向飛碟并非正式奧運比賽項目,雙向飛碟比賽是男女混合項,就是說,女運動員被允許參加該項目的男子比賽。
張山之前,這個項目一直由男子選手獨攬金牌。而就在1992年,張山改變了這一切。
預賽中,張山以150靶全中的成績成功進入半決賽;接著,又在半決賽中平了世界紀錄,以200發(fā)200中的成績闖入決賽。
在決賽中,張山獨自面對5名男子選手的挑戰(zhàn)。終,她贏得了比賽,也贏得了全場的尊重和歡呼。
頒獎時刻,分獲銀牌和銅牌的對手將張山高高扛起。一張經(jīng)典照片也有中國射擊隊另一位傳奇——許海峰當場記錄下來。
還有第一位正式參加波士頓馬拉松的女性——凱瑟琳·斯威策(Kathrine Switzer)。
1967年,19歲的凱瑟琳“冒天下之大不韙”隱瞞性別報名了波士頓馬拉松。在當時,馬拉松被認為是“女性不宜”的運動,甚至就在凱瑟琳本人的比賽過程中,主辦方工作人員突然出現(xiàn)要撕掉她的號碼牌,并沖她大吼:“你給我滾出賽道”。
直至她跑完全程,組委會也不承認她完賽的事實,還痛斥她擾亂了比賽。
“你想證明什么?”
這是當時的記者追問凱瑟琳的問題。
60年后的今天,凱瑟琳親自在巴黎的這8分鐘里給出答案:
不只是我,每個女性都有資格去做她想做的事。
這就是《永不失色的她》影片中的三位主角。為了讓屬于她們的歷史瞬間更加真切、生動地被還原出來,可以看到,阿里云用AI修復技術,為老照片和老視頻進行了上色和基于生成技術的補全。
該項目主要包含三大處理步驟。
清晰化:借助圖像超分辨率技術,將低分辨率的老照片轉(zhuǎn)化為高分辨率的清晰圖像。
上色化:通過先進的圖像上色技術,為黑白照片添加逼真的色彩。
基于生成技術的視頻插幀補幀。
具體涉及的技術方案,包括基于生成對抗網(wǎng)絡和卷積神經(jīng)網(wǎng)絡的圖像上色、圖像去噪和超分辨率,以及可控圖像生成技術等。
《她》背后的AI技術
聽上去,老照片、視頻修復并不是什么新鮮事,但實際上當修復的對象變成運動影像,背后的技術難度就大大增加了。
舉個例子,蘇珊·朗格倫的照片拍攝于100年多前,效果是這樣的:
一方面,人臉已經(jīng)看不太清楚了。
另一方面,背景觀眾眾多,增大了修復的復雜性。
阿里云修復團隊想到的解決方案,是利用大模型+Stable Diffusion等生成式AI技術,加入文本引導,讓AI發(fā)揮想象力的同時,對這種想象加以控制,使之不脫離歷史本身。
具體來說,技術人員先利用擴散技術對人物面部進行重繪。在重繪過程中,為了保留原始人物信息,會結合真實的史料信息作參考,并采用ControlNet等技術,對人物面部的線條、深度等都進行了控制。
對于復雜的背景,由于透視關系,本身就比較模糊。修復團隊采用的方案聚焦照片中的重點人物、元素進行修復,對背景則只進行小范圍的修復,后再將前后景拼接起來。
為了讓色彩更加自然,阿里云修復團隊還結合了歷史學家的專業(yè)意見,通過對歷史色彩庫的學習,讓AI上色的準確率達到了80%以上。
另外,在超分辨率方面,阿里云的技術方案能在1秒內(nèi)把640p分辨率圖像超分到4k分辨率,清晰度提升25倍。
視頻修復方面,阿里云修復團隊主要解決了視頻前后一致性和連續(xù)性問題。
舉個例子,修復一段跑步視頻,如果只是做逐幀上色,算法有可能把運動員的褲子一會兒上成紅色,一會兒上成黑色。
修復團隊對此進行了專門的優(yōu)化,包括對視頻進行細致拆分,逐個片段將上色效果、清晰度調(diào)整到佳。
運動影像還有一個特點,是運動變化很快。對此,阿里云修復團隊基于生成技術,對老視頻進行了插幀補幀,以達到更好的連續(xù)性效果。
事實上,由于修復的難度,后我們看到的巴奧這8分鐘的成片,是在多輪反復修改后呈現(xiàn)的。
在這個過程中,修復團隊一遍又一遍耐心地揣摩,甚至“已經(jīng)看不出哪一張更像本人了”,核心原因,是在修復的過程之中,技術人員自身也受到了女運動員們的鼓舞:
希望能通過修復這組照片,讓更多人了解到歷史上的這些重要事件。同時也希望通過修復技術,讓凱瑟琳女士等打破障礙、提高競技標準的女性的精神激勵更多人。
這也正是前沿科技對于歷史文化遺產(chǎn)的價值所在:
AI能夠讓生活在當下的人們更直觀、更真切地感受到埋藏在歲月長河里的歷史印記??萍剂α空谌祟惾宋木竦难永m(xù)和保護中發(fā)揮越來越大的價值。
其實,每一屆奧運會不僅給運動員,也給觀眾們帶來了很多感動和淚水。
當故事連點成線,在百年甚至更長的時間維度去觀察,這些感動會凝結成更值得傳承和銘記的人文精神。
《永不失色的她》是如此。那些賽場上更高、更快、更強、更團結的精神亦是如此。
AI技術的加持,加強了對歷史影像的保護和傳播,一方面能讓公眾更低門檻地了解其中故事和發(fā)展。
另一方面,也讓大家看到了人文與科技更深層次結合帶來的價值。
One More Thing
前面說到,巴黎奧運會是首屆廣泛應用AI技術的奧運會。
如果你也關注了比賽,這樣高自由度、“子彈時間”式的回放畫面想必并不陌生:
另外,在巴黎奧運會上,云計算正在替代衛(wèi)星,成為奧運賽事直播的主要方式。超過三分之二奧運直播信號將通過阿里云支撐的奧運轉(zhuǎn)播云,從巴黎傳輸?shù)饺?00多個國家和地區(qū),走向數(shù)十億觀眾。
而云+AI的組合,正在給坐在屏幕前的全球觀眾,帶來更多新鮮、酷炫的體驗。
奧委會主席巴赫評價:阿里巴巴用云計算和AI技術為奧運會和體育的未來作出了寶貴貢獻。
在奧運會的技術進程中,現(xiàn)在,中國技術力量成為了舞臺中心那一個。
本文鏈接:http://morphism.cn/news41300.html燃爆!奧運8分鐘AI影片火了 巴赫主席:感謝中國黑科技