我曾经憧憬过,当ChatGPT的威风吹遍全球,AI浪潮掀起之时,人工智能生成内容(AIGC)与机器人的美妙组合一定会创造出新的奇迹。然而,时至今日,这条路似乎仍有不少阻碍。去年10月,Stable Diffusion(文生图)的幕后公司Stability AI瞬间爆红,获得超过1亿美金的融资,公司估值达到10亿美金,成为新晋独角兽企业。这个团队备受投资人看好,是除OpenAI外最火热的AI公司。创始人Emad Mostaque(中文译名:伊玛德·莫斯塔克)也因此成为新的硅谷“金童”。然而,几个月后,这个美好的愿景似乎受到了挑战。AIGC+机器人的组合并没有如此顺利,它们中间似乎存在着中道崩阻。我惊讶的发现,半年之后,Stability AI这家公司及它的创始人竟被爆出了各种各样的丑闻。近日,福布斯杂志列出了Stability AI的“九宗罪”,这其中不仅仅包括偷窃技术、履历作假等,甚至还有后续融资失败、之前7亿融资以烧光、拖欠员工薪水等黑料。这家公司的行为真的是太不道德了。最让人震惊的是,他们竟然盗走了别人的智慧成果。去年10月,Stability AI 刚完成融资,一个名为 Runway 的 AI 公司立刻发布了一个 Stable Diffusion 的新版本并表示自己才是 Stable Diffusion 的作者。这可真是咄咄逼人!我听说,Stable Diffusion的前身是一群德国学者创造的名为 Latent Diffusion 的开源图像生成器。与此同时,一个名为 Runway 的 AI 公司合作推出了这个图像生成器,但当时该模型仅有少数的 GPU 用于训练。这个时候,Stability AI 的创始人莫斯塔克提出可以为他们提供超级计算机,于是两家公司一拍即合,同年8月,Stable Diffusion 正式诞生了。但是,接下来的事情可真是一个让我觉得无比愤怒的故事。Stability AI 到了整个融资过程中,居然将 Stable Diffusion 描述为自己的作品,并通过自己强大的宣传部门试图掩盖这段经历。而在所有的新闻稿中,创作团队的名字从来没有被提及。这可真是太不尊重别人的创意了!可不敢想象,Stability AI 这个 AI 明星独角兽竟然被爆出了这么多丑闻。更严重的是,公司暴露出了财务方面的问题。在福布斯采访的30多个人中,包括了该公司的前员工,有8位员工向透露,Stability 曾经拖欠工资超过一个月,以及拖欠该上交的工资税。最近,英国税务机构竟然到访了公司办公室,并因税款拖欠而要查封资产。与此同时,公司也被爆出之前的 1 亿美元融资已经烧光了。虽然对外宣称每年的收入数千万美元,但据内部人士透露,实际营收不足1000万美元。这可真是让人大跌眼镜!我所在的公司 Stability AI 真是麻烦不断。我们一直推销着一个估值为 40 亿美元的新融资项目,但一直受到阻挠。因为我们的商业化模式并不明朗,一些投资者似乎对我们并不是很信任,所以这个融资一直没有达成。对此我也感到有些无奈。最近,公司的老板娘 Zehra Qureshi 从公司的银行账户转出了数万英镑,她是公司的公关主管。尽管老板 Mostaque 在博客中回应说这是妻子和公司之间的“债务问题”,已经在2022年完全结清。但这个节骨眼上似乎这个说法不能让大家信服。这让公司的形象更加雪上加霜。虽然我们的机器人已经具备万事俱备的条件,但我们仍旧苦等着 AIGC 带来的东风。但看来现在,我们面临的问题还有很多需要解决。我觉得,目前实现“AI+机器人”的最大难点就在于国内缺乏稳定而领先的 AI 技术。近些年,随着工业机器人在制造业的推动下,在国内形成了爆发式增长。与此同时,人们对美好生活需求的不断增加,也带动了服务机器人的消费。在这几年内,众多机器人制造商相继上市、出海,使得国内机器人行业非常蓬勃发展。但是,就算如此,AIGC 仍然让人觉得未能走在前列。尽管百度、阿里、讯飞等企业相继推出了自己的大数据模型,但热度以及应用人数和案例等方面仍然无法比拟 OpenAI 的 ChatGPT。其实我觉得,国内并不缺少 AI 大牛,只是他们在这场热热闹闹的 AI 大潮中显得格外安静。微软的总裁前不久在采访中提到,目前国际上有三家机构在 AI 领域处于前沿地位,分别是微软的深度合作伙伴OpenAI、谷歌和北京智源人工智能研究院(BAAI)。智源研究院从2020年开始就开始着手训练「悟道」大模型项目,悟道2.0公布的参数规模已经高达1.7万亿,比 ChatGPT-3 的参数规模大了近十倍,而ChatGPT-3公布的参数规模仅仅只有1750亿。最近几个月,各种大型AI赛事中的冠军普遍来自国内研究团队,这说明我们在AI领域上的竞争力正在逐渐增强。 我们虽然还面临着 PaLM 2 等全球领先技术的竞争,但我相信随着国内优秀科研人员的不懈努力,研究水平也一定会越来越高。在最近几个月中,各种大型AI赛事中的冠军普遍来自国内研究团队。虽然 PaLM 2 等全球领先技术仍然存在,但我相信我们在 AI 领域上的竞争力正在逐渐增强。这表明我们在这个领域中的实力正在不断提高。虽然有些全球领先技术的模型频繁出现,但是智源却在这段时间内一直坚持默默无闻。除了4月份发布的SegGPT之外,有关AI大模型的任何信息都没有公开,直到6月上旬,新的开源大模型“悟道3.0”才在智源大会上向公众亮相。开源模型被许多人寄予希望,认为它可以拆除头部企业大模型的护城壕。当智源研究院理事长张宏江询问 OpenAI 首席执行官Sam Altman 关于开源问题时,Sam Altman 表示,OpenAI 将来会开放更多代码,但没有具体的开源时间表。未来,开源大模型将有效降低 AI 的使用成本。企业无需花费太多资金与人力,就可以更高效地推动AI的商业用途。到那个时候,“AI+机器人”这一设想,也许才能真正地实现并应用到实际中。

By admin