文章
  • 文章
搜索
首页 >> 吴老师投资随笔 >>文章/作品 >> 软件及服务:大模型高速迭代 多模态时代到来
投资随笔
更多
详细内容

软件及服务:大模型高速迭代 多模态时代到来

时间:2023-03-13     作者:吴老师股票合作【原创】   阅读

 热点速评

      事件

      ChatGPT关注度持续,海外和国内迎来技术的快速迭代推进。其中,谷歌于3 月6 日发布跨模态模型PaLM-E,而百度和微软也各自计划在未来一周召开发布会,GPT-4 也将在下周发布。这些消息引起了业内外的广泛关注,表明人工智能技术和应用正在高速发展,不断突破技术天花板。

      评论

      谷歌发布5620 亿数的跨模态超大模型,并搭载于机器人以执行复杂任务。谷歌于3 月6 日发布了视觉语言大模型PaLM-E,参数量达到5620亿,是已知的最大的VLM(视觉语言模型),相比国内的图文多模态模型主要用于图文生成和检索,该模型具备多模态推理和分析能力,并集成了可控制机器人的视觉和语言能力,能在日常生活中完成人类给出的指令;百度将在3 月16 日发布“文心一言”,将能够提供多模态生成能力。百度于2 月28 日晚在其官方微信发布消息,计划于3 月16 日14 时在北京总部召开主题为“文心一言”的新闻发布会。百度创始人、董事长兼首席执行官李彦宏和百度首席技术官王海峰将出席发布会;微软整合ChatGPT技术和应用开发平台,并在3 月16 日召开发布会。微软于3 月6 日宣布将ChatGPT技术与其低代码应用平台Power Platform整合,可以在很少编码的情况下开发应用。微软同样将于3 月16 日举办一场名为“与AI一起工作的未来(The Future of Work with AI)”的在线活动,讨论“用人工智能重塑生产力”,并展示其在人工智能领域的最新成果,例如ChatGPT在Teams、Word和Outlook等Office生产力套件中的应用;Visual ChatGPT和待发布的GPT-4 将加入视觉功能,拓展多模态应用。

      微软在3 月8 日发布并开源了Visual ChatGPT,该模型包含不同的视觉基础模型,用户可以通过图像与ChatGPT进行交互,并提出复杂的视觉问题或编辑指令。微软德国CTO Andreas Braun也在3 月9 日的名为“AI inFocus-Digital Kickoff”的活动中表示,GPT-4 将在下周发布,该模型提供多模态功能,其中包括视频方向应用。

      我们认为,以ChatGPT为代表的大模型技术突破和应用落地,关键在于弱人工智能向强人工智能的更近一步,有望打开中长期场景想象空间。在大模型路径下,多模态模型在海外已经推出,我们认为国内互联网公司和AI龙头也具备布局跨模态模型的技术基础,为生态打磨做好铺垫,未来将会有更多智能化的应用和产品出现,人工智能也将进入新的阶段。

      风险

      技术进展不及预期,行业竞争加剧,商业化落地节奏不及预期。

最新评论
请先登录才能进行回复登录

Copyright @ 2018 . All rights reserved. 

技术支持: CLOUD | 管理登录
seo seo