不能“套壳”ChatGPT 后,创业者不如真正去做好企业级的应用“杀手”,打造一条属于自己领域的垂直壁垒?
8月1日,有消息称根据苹果AppStore官方通知注册美国苹果id电话验证码错误,中国区应用商店所有应用不允许提供ChatGPT相关服务,有提供的应用需要下架整改,包括opencat在内的数十个AI应用被下架。
今年四月份,国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》的通知,并公开征求意见。这个文件涉及到生成式人工智能的相关规定和管理措施,可能与苹果官方通知中国区应用商店禁止提供ChatGPT相关服务有关。
显然,“套壳ChatGPT”这个创业和产品方向在中国已经行不通了。那么在AI领域,真正适合中国创业者的创业方向有哪些?我们先参考海外。
The Generalist (适道注:一家海外知名的创投深度媒体)的创始人和首席编辑Mario Gabriele近期对话了九位顶尖的AI投资人,他们分享了9个AI领域的创业新趋势,欢迎中国的AI创业者参考:
Copilot——这个单词翻译过来是“副驾驶员”,顾名思义,也就是能辅助人类工作的AI。
例如GitHub Copilot就是帮助程序员编写、测试和优化代码的“副驾驶员”, 它可以根据注释和你正在编辑的文件的上下文为你提供代码建议,也就是说,《流浪地球2》里自动生成程序的世界已经近在咫尺了。
同理,法律行业的Copilot可以帮律师查询过往的案件和实践范例,帮助起草合同等其他法律文件,还能辅助律师们找出各种法律文件中的错误。在这个细分方向已经有不少创业公司,例如Even UP、Harvey、Lexion等。
建筑行业的Copilot可以帮助建筑师们设计、模拟和优化他们的建筑和结构,还可以生成交互式的可视化效果,并帮助评估项目的环境、社会和经济影响。
“新的人工智能工具以前所未有的方式提高效率。它们帮助专业人士提高自己生产力水平,这带来的经济收益不亚于一场工业革命。对于使用这些工具的专业人士来说,他们会有更多的时间专注于工作中最具创造性、战略性和新颖性的部分。在五年之内,每一种主要的职业都会有一个AI放大工具。” Greylock联合创始人Reid Hoffman表示。
生成式AI除了AIGC和大模型,还有什么领域值得看?Air Street Capital合伙人Nathan Benaich认为大模型最有影响力的应用方向应该是与生命科学等领域的结合。
“现在的科学方法深深植根于数据驱动的实验中,这些解释生物系统的数据,精度和规模不断提高。我们利用人工智能去解析蛋白质、细胞和化学分子式,这种能力可以推动蛋白质结构预测和药物分子设计的突破。人工智能驱动的生物技术公司将颠覆万亿美元的制药行业,让新药研发速度更快,成本更低。”Nathan Benaich介绍到。
加拿大公司Valence Discovery就是这个领域的典型代表。它能用生成式人工智能驱动的设计方法创造全新药物分子,这些药物分子结构往往十分复杂,无法用传统技术处理。Valence还与研究机构们合作,进行超大型的生成化学计划,探索当前生成式人工智能药物设计方法的边界。今年五月,这家公司已经以4750万美元的价格被AI制药公司Recursion Pharma收购。
目前,人类与大语言模型交互的界面基本是文本框,人们通过Prompt(提示词)让大语言模型做各种各样的任务。提示词工程和提示词工程师也成为最新、最热的技术和职业,各种思维链,思维树等高等级的提示词技巧层出不穷。
但是,提示词并不是万能的,一方面,它基本来自于大量试错和灵光一闪的技巧,而不完全来自逻辑,毕竟谁也不知道大模型理解提示词的“黑盒子”是什么。
另一方面,相同的提示词不一定能带来相似的结果。如果你想把大模型嵌入自己的工作流,肯定希望提示语带来的结果更加可控。
对于第一个问题,一些公司为个人和企业用户提供经过多次试错和优化后得出的最佳提示词模板,也有不少开源项目在这个方向耕耘。
对于大模型的可控性问题,Conviction创始人Sarah Guo分享了自己的观点:“提升大模型的可控性,不能只从提示词等人机交互手段入手,还得从大模型本身去改进。Ilya Sutskever(适道注:OpenAI的联合创始人和首席科学家) 将“提示词”视为人类与大模型交互的一个暂时的过渡手段,我非常同意。
未来,我们希望人工智能对人类意图的理解越来越准确。但因为人类的意图通常是变化的,所以人工智能不仅要理解“意图”,更要理解人类的‘思维方式’。因此,大模型还会不断进化,直到让用户觉得更‘可控’。”
生成式AI是一种全新的技术,它也催生了新的软件形态,但普适的商业问题对于AI领域创业者仍然适用:你能否基于生成式AI构建一个产品,解决某个问题的效果比传统方式好10倍?随着时间的推移,你能否构建出自己的护城河?
FirstMark的管理合伙人Matt Turck认为新晋的AI视频独角兽Synthesia是一个很好的例子。用户只需在Synthesia的系统中设置几行文本,进行几个步骤的简单操作,几分钟内,Synthesia就能生成特定个人形象的专业解说视频,还能将视频解说的文本自动翻译成60种以上的语言。
Synthesia可以在多个企业级场景中使用,例如新员工的入职培训。在这个场景里,以往企业需要花费数十万美元请专业的团队和真人出镜来制作视频,而现在则只需要简单的设置就能花很少的钱在短时间内做同样的任务。
此外,Synthesia拥有强大的技术团队,它的视觉大模型是自己训练的,不会遇到那些使用闭源大模型API的公司需要面对的平台依赖性问题,因此拥有自己的核心竞争力。
GitHub Copilot的发布,让很多专业人士发现,人工智能模型已经能辅助专业的软件工程师编写代码。
GitHub Copilot会在编程界面内对代码编写提出修改建议,甚至能根据自然语言描述自动生成可用的代码。一些使用GitHub Copilot的软件工程师表示,它每天都能帮助人们节省几小时的工作时间。
Kleiner Perkins合伙人Leigh Marie Braswell认为:“GitHub Copilot证明人工智能已经有能力将编程和应用开发自动化变为现实。企业用户们可以用人工智能帮助执行自动化代码审查、代码质量改进、shell命令自动完成,甚至前端和网站生成等高级任务。”
Braswel还进一步介绍了AI编程领域创业公司的发展路线:“一些公司基于Codex这样的闭源大模型构建产品,并通过专有的数据形成数据飞轮构建差异化。
另一些公司则训练自己的专有大模型,或对开源大模型进行微调。随着这些公司逐渐成熟,我们将更清楚的看到这个领域大部分的价值将积累在哪个方向,是AI基础设施提供商,还是AI垂直应用。”
谈到AI与生物医药,人们最熟悉的产品可能是DeepMind的AlphaFold,它的论文也登上了顶刊。
AI在医疗领域的另一个高潜力应用是在临床试验中使用数字孪生技术,它虽然暂时关注度和融资额不高,但可能帮助数百万患者找到更好的药物和治疗方法。
现在的临床试验效率低下、成本高昂,平均每种新药需要花十年以上的时间和20亿美元的投入才能开发完成并上市销售。
临床试验最大的痛点之一是试验志愿者的招募,一个临床试验需要招募成百上千名志愿者参与其实验和对照组的研究,80%的临床试验由于志愿者招募问题而出现延误。
Radical Ventures合伙人Rob Toews介绍了数字孪生在临床试验中的应用方式:“数字孪生应用于临床试验的基本概念很简单:利用生成式人工智能模型为临床试验中的志愿者模拟安慰剂效果—每个参与试验组的志愿者都会拥有自己的数字孪生,模拟如果他们被分到对照组,其表现会是怎样的。
这意味着制药公司需要招募的试验志愿者大大减少,因为大部分对照组的志愿者可以由数字孪生替代。这使临床试验变得更快、更便宜,药物和治疗方案可以更快地上市。”
随着生成式AI越来越普及,越来越多的人体验到相关产品,我们对它的能力和特点有了更好的理解:那些有大量训练数据,对结果的精确度要求不是非常高,以及能够随着人类反馈逐渐做的更好的问题,是它擅长解决的。
AI已经逐渐跨越鸿沟进入主流,它将越来越多地被我们在工作中使用。AI Agent和AI增强的SaaS是两类最适合被企业使用的工具,也是非常好的创业方向。
AI Agent适合辅助律师、工程师、会计师、医生这些专业人士完成重复性高的知识类工作。AI增强的SaaS则利用AI的能力完成一些以前不能自动完成的工作,例如语言转录,会议内容总结,以及其他有价值的能力。
Index Ventures合伙人Cat Wu对哪一类创始人能在这个领域脱颖而出有自己的观点:“将AI能力嵌入现有的工作流,这个方向适合那些懂用户、懂行业,并且能够借助用户反馈的数据把模型微调得更好的创始人。
一方面,他们要让用户不懂AI模型也能用好AI能力,另一方面,他们可以将用户的数据高效利用,形成数据飞轮,构建护城河。”
同时,Cat Wu也对创业者们提出了忠告:“这些创业者应该专注在自己的核心能力上,而不是沉迷于训练基础大模型。基础大模型可以用那些具备强大能力的开源模型,例如,文生图模型Stable Diffusion怎么把苹果id改成美国id,音频转录模型Whisper,以及Meta的大语言模型Llama 2。然后再在这些模型上微调就好。
他们应该着力解决人类与AI模型的交互问题,以及尽量降低人们使用AI的门槛,并充分利用好人们在使用AI模型时产生的数据,不断迭代和提升AI和产品的能力。”
用提示词让大语言模型按照人类的意图做任务,已经是人们熟悉的体验。但是目前人们在使用大语言模型能力时,让它完成的工作大多是单步骤的简单任务,例如图像生成、文本完善等。
如果我们能构建链接提示词的基础设施,使大语言模型完成多步骤的复杂任务,将解锁更大的价值。
这对于ToC和ToB的使用场景都有影响,尤其是对于ToB,大语言模型结合专有的数据管道完成多步骤复杂任务,将让它适应更多的行业和场景。
“将提示词和不同类型的模型链接在一起使用,将比单纯使用闭源大模型的API更有价值。例如新型搜索引擎WebGPT,它将GPT大模型能力嵌入到浏览器中,让GPT联网查询和总结海量信息,完成多步骤的复杂任务。
总的来说,将多个提示词链接在一起完成复杂任务,可能诞生新类型的软件产品。将AI和人类的创造力整合起来,可能催生一些解决问题的新范式和新方法。”Compound管理合伙人Michael Dempsey总结了AI驱动的多步骤自动化具有哪些先进特性。
最新的AI大模型有众多突破性进展,这些突破使不少业务被重构。但是,它们暂时还没有把影响力大规模延伸到现实世界。餐馆、建筑工地和工厂等办公室之外的工作场所面临着非常严重的劳动力短缺。
在美国,焊工的平均年龄是55岁,技术娴熟的人类焊工每年数量减少7%,对焊工的需求却增加了4%。到2024年,美国将有40万个人类焊工的缺口。
Basis Set Ventures的创始人Lan Xuezhao介绍了自己的被投企业Path Robotics,它也是专注于机器人赋能制造业的头部企业:“Path为企业客户提供各种金属应用的自动焊接服务,从电线杆到液压燃料罐到消声器。接入Path的软件后,客户现有的机器人可以直接通过视觉学习如何焊接,而无需为了新任务重新进行复杂编程。客户也可以通过这种方法逐渐提高机器人性能。在未来,Path的核心技术可以应用于许多其他的制造业任务,扩展其业务边界。”
在这波生成式AI的发展热潮中,海外创业者们在基础大模型领域已经“过峰”,他们已经拥有GPT-3.5/GPT-4等闭源大模型,Llama 2等开源大模型,Cohere等公司还推出了可定制,多云适应的商用大模型。
如今,海外创业者现在进攻的方向,一方面是做垂直应用,例如Synthesia、Even UP、Harvey;另一方面是做中间层和基础层,例如解决AI模型训练的数据源稀少问题,降低AI模型部署和微调的门槛,在这些方面有Replicate、Cleanlab、Unstructured等公司。
而在中国市场,“大模型”的PK似乎才刚刚开始。应用层面,此前很多创业者用海外大模型“套壳”做聊天机器人、图片生成软件等应用的道路已经在近期被堵住,新的方向亟需探索。
尽管在媒体和舆论中,中国风险投资人们对生成式AI的热情很高,但反映在一级市场的投资笔数和投资金额上,中国与美国暂时还有明显的差距。以2023年1-7月为例,根据Crunchbase的数据,美国的人工智能领域投资事件为919笔,根据企名片数据,中国则为439笔,中国的投资数量不到美国的一半。
国内投资人的“谨慎”或许在于:一来,海外大模型的商业价值还未在短期内产生;第二,AI领域的技术迭代极快,还未看到“群雄逐鹿”的终点;第三,从上游技术研发到下游垂直行业的应用成熟需要存在一个较长的周期,其中也包括了多场景的覆盖、市场需求的挖掘,需要相关领域的投资者有长远的眼光和耐心。
但随着大模型狂热正在逐渐回归现实,国内大模型创投市场或许可以从本期对话中的九个趋势获得启发——与其PK无法落地商用的大模型,不如先从做好企业级的应用“杀手”开始,打造一条属于自己领域的垂直壁垒?