新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)對(duì)于AI大模型應(yīng)用,人們已經(jīng)熟悉了“文生文”、“文生圖”以及“文生視頻”。而12月17日,騰訊混元發(fā)布世界模型1.5(Tencent HY WorldPlay),提供了“文生3D”和“圖生3D”能力。


具體來(lái)看,用戶輸入文字描述或者圖片即可創(chuàng)建專屬的互動(dòng)世界,通過(guò)鍵盤、鼠標(biāo)或手柄實(shí)時(shí)控制虛擬相機(jī)的移動(dòng)和轉(zhuǎn)向,像玩游戲一樣自由探索AI生成的世界。這是國(guó)內(nèi)首個(gè)開(kāi)放體驗(yàn)的實(shí)時(shí)世界模型,用戶可以在騰訊混元3D官網(wǎng)申請(qǐng)使用(https://3d.hunyuan.tencent.com/sceneTo3D?tab=worldplay)。


同時(shí),混元世界模型1.5(WorldPlay) 首次開(kāi)源了實(shí)時(shí)世界模型框架,涵蓋數(shù)據(jù)、訓(xùn)練、流式推理部署等全鏈路、全環(huán)節(jié),并提出了重構(gòu)記憶力、長(zhǎng)上下文蒸餾、基于3D的自回歸擴(kuò)散模型強(qiáng)化學(xué)習(xí)等算法模塊。


混元世界模型1.5帶來(lái)世界建模的全新可能性,用戶可以在生成的世界里隨意移動(dòng)探索,離開(kāi)某個(gè)區(qū)域后再次返回時(shí),模型能夠"記住"該區(qū)域的三維結(jié)構(gòu),呈現(xiàn)前后一致的場(chǎng)景——這種空間記憶能力標(biāo)志著模型在三維世界理解上的突破。此外,用戶還可以選擇將用于交互的3D場(chǎng)景導(dǎo)出為可多次使用的3D點(diǎn)云。


編輯 楊娟娟

校對(duì) 柳寶慶