【盘中宝】Meta终于出手,AI视觉领域迎来“炸场”,行业或迎“GPT-3时刻”,这家公司相关技术在众多场景上的应用已经较为成熟 提供者 财联社

  • Post category:股市
  • Reading time:1 mins read

【盘中宝】Meta终于出手,AI视觉领域迎来“炸场”,行业或迎“GPT-3时刻”,这家公司相关技术在众多场景上的应用已经较为成熟 © Reuters. 【盘中宝】Meta终于出手,AI视觉领域迎来“炸场”,行业或迎“GPT-3时刻”,这家公司相关技术在众多场景上的应用已经较为成熟

科创板日报获悉,AI视觉领域迎来新模型“炸场”,图像识别门槛大幅降低。这场AI热潮中鲜见动静的Meta终于出手,推出Segment Anything工具,可准确识别图像中的对象,模型和数据全部开源。

一、计算机视觉领域迎“GPT-3时刻”

Meta的项目包括模型Segment Anything Model(SAM)、数据集Segment Anything 1-Billion mask dataset(SA-1B),公司称后者是有史以来最大的分割数据集。

引起业内轰动的便是这一SAM模型,该模型可以用于分割图像中的一切对象,包括训练数据中没有的内容;交互方面,SAM可使用点击、框选、文字等各种输入提示(prompt),指定要在图像中分割的内容,这也意味着,用于自然语言处理的Prompt模式也开始被应用在计算机视觉领域。对于视频中物体,SAM也能准确识别并快速标记物品的种类、名字、大小,并自动用ID为这些物品进行记录和分类。

英伟达人工智能科学家Jim Fan将Meta的这项研究称作计算机视觉领域的“GPT-3时刻”之一——其分割方法可以通用,可对不熟悉的物体和图像进行零样本泛化,初步验证了多模态技术路径及其泛化能力。

二、多模态发展将带来AI泛化能力提升

国盛证券预计,预计1-5年内,多模态发展将带来AI泛化能力提升,通用视觉、通用机械臂、通用物流搬运机器人、行业服务机器人、真正的智能家居会进入生活;5-10年内,结合复杂多模态方案的大模型有望具备完备的与世界交互的能力,在通用机器人、虚拟现实等领域得到应用。

三、相关上市公司:当虹科技 罗普特 创维数字

当虹科技AIGC相关技术在媒体演播室、智能媒资平台等众多场景上的应用已经较为成熟,可为电视台、新媒体、互联网、泛媒体行业等客户提供通过AI技术进行短视频、长视频的生产/加工等解决方案。

罗普特多年来专注于人工智能产品的研发与行业应用,以“计算机视觉”技术为牵引,在图像存储、分析、处理及传输等技术领域取得了一系列科技成果,行业应用覆盖了城市信息化、公共安全、工业物联网、商业生活等各类场景。

创维数字研发中心下设智慧研究院,在人工智能中已积累了计算机视觉(CV)算法、自然语言处理(NLP)算法、语音识别算法、AI画质增强算法、手势识别算法、边缘计算等差异化的AI应用技术。

近期热门系列:

4月3日《光模块中最核心的器件,AIGC算力催生需求,这类产品有望快速放量,这家公司正在开发的芯片可以用于该领域,相关产品研发进度顺利》

4月3日《行业巨头发布行业大模型产品,有望成为垂直GPT率先落地的场景,这家公司已成为文心一言首批合作伙伴》

3月30日《AI赋能这个领域,从需求到供给改革行业生态,这家公司入选首批该计划合作伙伴单位》

3月29日《AI大算力场景下重要新技术路线,这类产品销量四年有望提升达90倍,这家公司已推出相关产品》

【盘中宝】Meta终于出手,AI视觉领域迎来“炸场”,行业或迎“GPT-3时刻”,这家公司相关技术在众多场景上的应用已经较为成熟  

发表回复