计算机
多模态,AI大模型新一轮革命
投资要点:
- 多模态推动人工智能迈向AGI,底层技术日臻成熟
相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现的更加智能,能够执行更大范围的任务,有望成为人类智能助手,推动AI迈向AGI。就技术架构而言,多模态技术可拆解为编码、对齐、解码与微调等步骤,逐步挖掘多模态关联信息,输出目标结果。文生图CLIP模型为最先成熟的多模态技术,目前,多模态已不再局限于图文两层信息。例如,Meta-Transformer可同时理解并处理12种模态信息。
- OpenAI 谷歌开启多模态军备竞赛,Sora 和 Gemini 各领风骚
- 多模态提升大模型泛化能力,垂直领域应用场景广阔
投资建议:
我们看好具有算法、数据等先发优势的国产大模型厂商,同时多模态提升大模型泛化能力,多元信息环境下实现“多专多能”,在垂直领域具有广阔的应用场景和市场价值。
风险提示:
技术发展不及预期、产品落地不及预期、AI 伦理风险等。
报告内容部分提取👇
想了解该报告详情,可通过下方扫码关注后
回复“AI”
获取报告下载链接
想了解更多考试相关
扫码添加上智启元官方客服微信👇