最近一段时间在 LLM/AIGC 行业里一大批商业、开源大模型如雨后春笋般爆发式涌现(例如:文心一言,通义,混元,伏羲,盘古,MOSS,悟道等),各种基于细分场景的产品也纷纷抛头露面,例如基于心理情感陪聊的 EmoGPT,用于医疗问诊的 MedGPT 和用于法律问答的 ChatLaw 等等。
今天刚好把我最近的一些思路整理一下,浅聊一下 AIGC 形成生产力的问题。
对于大模型本身,很多大佬已经讲得很透彻了,支撑 AIGC 的三大支柱,即算法、数据、算力。算法决定智能水平,数据决定智能范围,算力决定智能效率。本文主要聊聊从 AIGC 构建生成力的过程要素问题。
在开始之前,有几个核心观点作为前置条件:
- LLM 的算法、数据、算力是相互影响的。简单地说,参数规模越大的模型需要的预训练数据量越大,也就需要更大的算力支撑。一味地追求模型规模是有瓶颈的。
- 不能普及到消费级的 LLM 不在本文讨论范围内。那些需要8GPU+,200GB+才能推算的模型不适用本文。
- AIGC 的场景是解决现实需求的场景。“AI是否取代人”请移步至科幻小说。
#
“精准”的“概率”我们知道 LLM 通过计算概率来推测结果,所有的结果都是被”预训练“出来的。足够的经验知识和足够的规模描述就能带来普遍意义上的期望结果。
这里“概率”就带来一个重要的要素:不确定性 。在 AIGC 文章创作场景里,不确定性带来“变化”,带来更多的话术描述,但是在科学计算和数据分析上,不确定性带来的是“胡说八道”。
一个询问日期的示例:
问:今天是7月5号,上周周一是几号?
答:今天是7月5号,上周周一是6月26日。
一些需要计算的场景,不仅要遵循既定的计算公式和逻辑,还需要隐藏的“常识变量”来补全信息。以上述示例为例,需要补全的信息是“今天是7月5号”就是2023年7月5日,补全年份信息。对应的计算逻辑就是日历的日期计算,以周为单位,向前回溯一周。
这个问题的答案是唯一的:6月26日。这里我们其实是不需要“概率”的。需要的是“精准”,需要答案在数理上的确定性。显然,要用 LLM 解决这个问题,最直接的办法就是训练模型推理出这是“日期计算”,把计算任务推给下游任务或者插件进行计算并返回结果。
那更复杂的任务呢?
问:把业务三部2022年1月到12月的差旅费用按照月为单位统计成图表进行展示。
答:……
问:昨天北京路分店的营业数据整理成图表进行展示。
答:……
你可能会说可以用“推训一体化”解决或者进行强化微调,对于百亿参数规模的模型来说,确定性并不稳定。
因此,我们需要的可能不是一个下游任务或者插件,我们需要“精准”的“概率”将话术“概率”映射到“精确”的数据上。确定性的要素提供先于 LLM 的不确定性发生。在 LLM 推理之前先锁定数据。
#
业务向上融合对于用户在业务上的提问,需要拟合业务要素。枚举语料是可行的,也可以用模型基于答案反向生成提问。
那问题来了,业务数据是一个庞大的数据库和知识库,怎么训练到模型里?
很多场景下我们是不需要提取业务数据进行预训练的,但这里有一个前提条件就是模型先要进行该业务的行业知识预训练或者迭代训练。处理文本向量之后构建新的 Prompt 进行推理。
上图是一个处理业务知识库的流程。在 Prompt 阶段进行数据融合,推理能力首先依赖的是文本向量处理的能力,这其实给我们机会在 Prompt 构建时也使用一个 LLM 来进行推理,这样我们可以在正文推理前,把业务融合到 Prompt 里。如果你在 LLM 行业创业,这是一个可以完美避开大厂的,可深耕的细分技术领域。
#
从 Question 回到 Prompt多轮对话是负担。
是的,对于用户来说多轮对话是负担,用户的问题应当是 LLM 的 Prompt 。请把我前述的前置条件考虑进来,从生产效率的角度来说,AI 需要以最短的路径找到答案。一次对话就应该带出所有的路径,而不是问题接续问题。
用户:我想买一辆SUV,你能为我推荐一些性价比较高的车型吗?
AI:您考虑多少预算区间的车型?
用户:20万左右吧
AI:您考虑什么车型?城市SUV还是越野车?
用户:……
上面是一个糟糕的用户体验设计。Chat 模式其实很多生产力场景下是不适用的。既然是人机交互的过程,那么就应该像贾维斯一样回到高效的人机交互形式,例如下面:
用户的提问对应的是一系列的 Prompt 及其描述,支撑问题的答案应当是直达答案的最短路径。Chat 不是唯一的模式,UI 应该融合 Chat,因此无论那种方式都应该是对当前 Question 的最短路径。这里涉及复杂的工程化路径问题,就不展开描述了。
这里并没有提及多模态的问题,多模态在 AIGC 生成力结构里是横向能力的增强,这里主要谈的是纵向能力的融合。
最后,任何技术的普及都是为人类的生活和生产带来益处,需要每一个环节的环环相扣!
命运深处涌动着更多浪漫,梦想破土生长更多答案,繁星背后太阳已开始灿烂。