自我更新,Shap-E同时支持纹理网格和NeRF两种类型3D表示,效果力压OpenAI另一开源3D模型。该模型的论文提出: 1. 与最近产生单一输出表示的3D生成模型不同,Shap-E直接生成隐式函数的参数,这些参数可以呈现为纹理网格和神经辐射场(NeRF)。 2. Shap-E的训练分成两个步骤: 1)训练一个编码器,该编码器确定性地将3D资产映射到隐式函数的参数; 2)在编码器的输出上训练条件扩散模型。 3. 当在包含成对的3D和文本数据的大型数据集上训练时,该模型能在几秒钟内生成复杂多样的3D资产。与OpenAI此前开源的点云上的显式生成模型Point-E相比,Shap-E收敛速度更快,并且尽管对更高维的、多表示的输出空间建模,仍可达到相当或更好的样本质量。
大语言模型开源社区一日千里,Shap-E引领3D生成“圣杯”进入“StableDiffusion时刻”。AIGC产业存在着“AI民主化”“AI平权”浪潮和浓厚的开源氛围。在AIGC的文字生成领域,自2023年2月24日Meta开源大语言模型(LLM)LLaMA以来,LLM的“Linux时刻”到来,Alpaca、GPT4All、Vicuna、Koala、OpenAssistant和HuggingChat等多个基于LLaMA的LLM诞生,ChatGLM、Dolly2、RedPajama、StableLM和MOSS等LLM也陆续出现,开源LLM渐呈燎原之势。而在文生图领域,StableDiffusion率先开源,与闭源的Midjourney难分伯仲。尽管OpenAI此次发布的Shap-E存在“对单个物体的理解能力较强,对物体的组合的理解能力较弱”“略显粗糙,细节缺失(如仙人掌的纹路)”,我们认为,Shap-E将吸引开发者不断提升AIGC的3D内容生产模型的速度和质量。
OpenAI、谷歌、英伟达引领AIGC3D生成浪潮,营销、游戏、建筑、工业数字孪生等多场景受益,元宇宙加速到来。当前在“文本生成3D”赛道,Shap-E的主要竞争者包括谷歌DreamFusion和英伟达Magic3D。3月,英伟达宣布与设计工具Shutterstock合作训练“文本生成3D”模型,计划随后发布。Shutterstock首席执行官PaulHennessy表示这一合作将大大缩短从创建到发布具有精美纹理、结构化的3D模型的周期。显然,3D比2D更生动形象,接近物理世界,是更好的元宇宙形象载体。我们认为,AIGC将深刻推动产业变革,给用户更真切的视觉体验,促成元宇宙的加速到来。
投资建议: 1. 算力:算力是AIGC蓬勃发展的基石,我们看好光通信及边缘算力,建议关注新易盛、中际旭创、天孚通信、太辰光、德科立、锐捷网络、寒武纪、美格智能、紫光股份、中兴通讯等; 2. 模型层:建议关注国内外大模型的边际变化,包括昆仑万维、三六零、科大讯飞等; 3. 应用层:我们看好游戏的迭代创新,包括恺英网络、神州泰岳、盛天网络、游族网络等; 4. 数据层:监管将是贯穿AIGC发展的挑战,看好中国移动、中国电信、中国联通、浩瀚深度、新华网、人民网等。
风险提示:伦理风险:人工智能与人交互过程中,可能出现伦理风险。市场竞争风险:开源大模型的发展一日千里,对商业公司而言,是机遇也是挑战。政策法律监管风险:随着相关法律的逐步完善,或出现法律监管的问题,例如在个人数据保护和知识产权保护方面出现大量纠纷。
本文节选自国盛证券研究所已于2023年5月7日发布的报告《OpenAI再开源3D模型,元宇宙加速到来》,具体内容请详见相关报告。
来源:
在广告业务失败的背景下,元宇宙成为Meta新的掘金点,并不奇怪。营销元宇宙没有商业限制的优势,Meta它似乎对元宇宙的未来充满了信心。在面对广告商的会议上,沙阿说:你通过我们的应用所做的一切都会让你在那里‘元宇宙’未来受...
工业元宇宙成熟于消费元宇宙2C和2B最大的区别是B端用户可以说出他们想要什么,C消费者说不出来。即使说出来,也可能不是真正的需求——这是华为在复制智能手机研发过程时的总结。例如,当智能手机出现时,问卷显示消费者并不特别关...
元宇宙的边界在哪里?人们很快就会知道元宇宙不仅是一个游戏,也是一个数字虚拟元宇宙世界。元宇宙将是未来虚拟与现实共存的巨大元宇宙世界!数字元宇宙的虚拟世界将远远大于物理世界。在虚拟元宇宙世界中。在虚拟与现实共存的概念下,宇...
近期2年什么语汇最引进关心呢?想来“元宇宙”一词一定会占据一席之地。据了解,2021年百度搜索、Google相关元宇宙一词的搜索指数均已做到数十亿量等级,与此同时2021年也是元宇宙年间。一方面,资产陆续重仓股,海外调查...