(相关资料图)
7月7日,2023年世界人工智能大会上,启明创投联合未尽研究发布了创投行业首份生成式AI报告。基于生成式AI的创新应用、大模型技术前沿、监管、安全、政策、人才等研究,报告对未来一至三年的大语言模型、多模态模型和商业竞争态势,作出了十点前瞻。
其中,大语言模型方面:
2024 年中国将出现比肩GPT-4的多语言通用大模型;超长上下文(Long Context) 将引领下 一次LLM技术突破;在出现更有前景的大语言模型之前,为实现垂直领域更好的效果,以下三种方式将共存: 在不改变数据分布的情况下,利用更多通用数据 进行通用大模型预训练,不特别引入行业数据;利用行业专属数据微调( Fine-Tuning)通用大模型;利用行业数据占比更高的数据集进行垂直模型预训练;多模态模型方面:
当前CLIP + Diffusion的文生图模型是过渡态,未来2年内将出现一体化的模型结构;下一代Text-to-Image模型将具备更强的可控性,它将结合底层模型能力和前端控制方式,对模型的设计将注重与控制方式的结合;2025之前,视频和3D 等模态将迎来里程碑式的模型,大幅提高生成效果;以PALM-E为代表的具身智能(Embodied AI)展现出在机器人的感知、 理解和决策等方向上的巨大潜力, 但当前训练和可靠性存在较大挑战;短期内Transformer正成为多个模态的主流网络结构, 但压缩整个数字世界的通用方法尚未出现,Transformer并不是人工智能技术的终点;商业机会方面:
3年内,颠覆式的AI应用的核心驱动力来自于底层模型的创新,两者无法解耦,模型的作用将大于产品设计的作用;当前生成式AI 市场处于技术主导的早期阶段, 存在千亿美元市值的平台性企业的机会。