Microsoft släpper öppen 4B-modell – gör bilder till 3D på tre sekunder
Microsoft har släppt TRELLIS.2, en öppen 3D-modell som kan omvandla en vanlig bild till ett texturerat 3D-objekt. Modellen finns publicerad på Github och har 4 miljarder parametrar.
Enligt Microsoft är TRELLIS.2 byggd för högupplöst bild-till-3D-generering. Vid upplösningen 512³ ska modellen kunna skapa form och material på omkring tre sekunder, testat på en Nvidia H100-GPU. Vid högre upplösning tar processen längre tid: omkring 17 sekunder vid 1024³ och omkring 60 sekunder vid 1536³.
Modellen använder en ny struktur som Microsoft kallar O-Voxel. Den ska göra det möjligt att hantera mer komplicerade 3D-former, som öppna ytor, interna strukturer och objekt med skarpa detaljer. TRELLIS.2 kan också skapa PBR-material, till exempel färg, metall, opacitet och ytsträvhet.
Koden är öppen under MIT-licens, men modellen kräver kraftfull hårdvara. Microsoft skriver att den är testad på Linux och behöver en Nvidia-GPU med minst 24 GB minne.