大模型落地钉钉从高频场景突破“你不必再为不同的任务使用不同的应用程序。只需要用日常语言告诉你的设备你想要做什么。根据你选择与它共享的信息量,软件将能够给出个性化的回应。不久的将来,任何上网的人都能拥有一个由人工智能驱动的个人助理。”比尔盖茨在最新的一篇博客指出,五年内一个全新的AI时代正在到来。AI将彻底改变个体使用计算机的方式,并颠覆软件行业。
硬币的另一面是,传统行业里的大量企业要到达智能化彼岸,需要跨越重重阻碍。为了降低大模型在企业端的应用落地门槛,AI能力平台和有场景的企业已经开始共创和探索。高频应用且存在刚需痛点的领域,如智能知识问答,正成为它们探索大模型落地的先行场景。
芯片设计厂商艾为电子和农牧食品公司铁骑力士等一批数字化先锋企业为例,它们与钉钉AI PaaS及Chat AI解决方案团队共创,着眼应用层,正在打造具有更强的语义识别和判断推理能力的智能问答应用。在这些共创企业里,大模型加持的智能产品,正解放一线技术工程师,实现了降本提效。
“再复杂的机械系统也是简单的系统,再简单的认知系统也是复杂系统。”这些简单的应用探索,正在为企业更深入应用AI提供支撑。大模型ToB,已经迈开步伐。
“XX产品的XX(指标)是什么要求?”这个问题很常见,在电商体系里,消费者发起这样的咨询时,客服甚至需要15秒内有回应。
但如果产品SKU有几千,涉及的子类别有几十种,包含不同领域的专业知识,同时每款产品参数也有几十个,客服该如何回复得快速、准确又专业?
这就是艾为电子的技术服务团队在日常工作里经常遇到的问题。作为国内知名芯片设计商,艾为电子的产品分声、光、电、射、手五大类别,产品广泛应用于消费电子、物联网、工业企业以及智能设备领域。
如果你见过芯片产品说明书,就会知道要熟悉几千种芯片的细节多么有挑战。通常情况下它由英文撰写,文件长度在几十上百页不等。但最大难度还不是体量大,而在于它涉及的知识门槛,里面包含了大量的技术专有名词、表格、电路图和各种技术参数。有时候一些表格之间还会互相关联,同时一些词汇在芯片产品说明书里的意思与通用的含义还会出现不一致。要准确回答海量的与产品参数相关的问题,非常考验回答者的行业知识,一般的客服人员根本无法应对这类问题。
艾为电子目前配置了七八十名技术专家,每天在本职技术工作之外,平均要花大量时间从产品说明书中来确认细节,回答这些复杂的专业问题。
在许多行业,企业通常会选择建一个智能客服系统来解决问题。但传统的客服方案会预先设置关键词,列好各种问题的答案。客户的问题触及关键词,系统会弹出提前准备好的答案。
这个模式也有弊端。如果没按预先准备的表述来提问,触发不了关键词,系统就识别不了问题。例如问题里提某项参数“不大于”某个值,而FAQ(常见问题解答)是按照“小于”这一关键词预备问题,就无法弹出准备好的答案。
一位资深技术人士告诉数智前线,命中关键词的模式下,系统通常还很难完成判别类任务。例如询问“71001这款产品支持2.7V的环境吗?”智能客服大概率会回答出产品所支持的电压环境区间如“0.3V~6V之间”。但这个回答依然不是客户提问的问题的答案,互动体验比较差。
农牧产业里的龙头企业铁骑力士也与艾为电子一样,需要处理来自外部客户的知识咨询和企业内的业务系统使用的培训需求。这是一家成立30多年的大型农牧企业,在全国有150余家分公司,在全国范围内有上百家合作的养殖户。
养殖户向他们采购饲料和养殖技术,最后养殖的生猪由他们回收。养殖期间,分散在各地的农户经常会向铁骑力士的技术人员咨询养猪过程中遇到的难题。例如猪拉肚子怎么办,有异常行为模式要怎么解决。有时候母猪半夜生产,农户也希望咨询公司的技术人员远程指导和帮助。而在企业内部,由于分公司众多,员工数量多,考虑到人员流动等多重原因,企业内此前建设25套业务系统的使用培训工作也颇为繁重。
之前这些工作要么靠人力、要么靠传统的问答工具来完成。但靠人力时工作太简单机械,靠传统客服问答系统来服务,也会碰到艾为电子遇到的客服智能程度不高的问题。这也是小模型时代AI应用碰到的普遍问题。超出知识库以外或者遇到新的环境及场景,模型和算法就无法适应新情境,应用的智能程度普遍显得不高。
大模型时代,事情正在起变化。大语言模型具备的语义理解能力大大增强了问答场景里的互动性,叠加企业已有的知识库沉淀,传统的客服问答场景里“命中”模式带来的智能程度不高等问题,正逐渐被解决。
艾为电子和铁骑力士等一批传统行业里的数字化先锋应用企业正尝试利用大模型技术,来解决企业固有的痛点。
但实际上,传统企业要把大模型技术在企业内变成真正的生产力工具,从底层技术支持到行业场景都需要经过漫长打磨。
铁骑力士CIO熊峰今年年初就尝试把大模型落地到企业内场景,此前这家企业在企业内知识培训和问答场景,使用传统智能客服产品已有2年多。
ChatGPT大火后,国内的大模型厂商纷纷推出大模型相关产品和应用,过去大半年来,各行业里的数字化先锋也积极探索将新技术应用到业务场景。今年4月,钉钉开始内测AI魔法棒产品,并发布了一些场景。经过几个月打磨,钉钉把与大模型相关的能力沉淀为AI PaaS对外提供服务。同时一些基于具体场景的解决方案如智能问答也雏形初现。有一批早已用钉钉作为数智化底座的企业,顺势开始在钉钉探索大模型落地。
铁骑力士于两个月前开始与钉钉的AI PaaS及Chat AI产品合作共创。与铁骑力士类似,今年大模型热潮开启之际,艾为电子就对这项技术产生了浓厚的兴趣。5月,钉钉智能应用解决方案相关团队向艾为电子表达与大客户共创大模型应用场景的意向时,双方一拍即合。
实际上企业内围绕管理及业务发展的痛点非常多。过去大半年来,业界观察到,经历场景的筛选和摸索,问答类应用成为不少企业率先尝试大模型落地的先行场景之一。
这与这类场景的特性有关。艾为电子CIO陆轶分享过,他们选择智能问答场景原因有三:一是企业切实存在痛点。二是这个领域里数据相对公开,不涉及到更多的隐私及保密需求。三是经过大模型的升级,可以把以往准备的知识资产更好利用起来。企业此前有接近几百个FAQ。大模型的语义理解能力大幅提升后,问题与企业内对应的FAQ能更好被提取出来,从而节省人力成本,提升用户体验。
这种筛选过程也反映了企业在探索大模型落地场景时的态度和思路。钉钉的Chat AI解决方案工程师王俊杰告诉数智前线,一方面企业的态度比较理性,在场景共创阶段,先有比较天马行空的设想阶段,之后很快会框定到能够带来切实效果的场景里。“如果是玩具,技术就没法落地,所以企业会很重视能带来生产力提升的场景。”
另外,通过POC验证,企业也看到原来无法突破的点有了明显改善。比如电压范围,之前产品表格上显示支持0.3伏~6伏,去问2.7伏支不支持,模型能够回答。问它7伏支不支持,它就能给出明确的答案是不支持。这些立竿见影的效果,也会激发企业对新技术应用的兴趣和拥抱大模型的热情。
过程里,钉钉的Chat AI解决方案团队、AI PaaS层以及应用共创企业都需要做不少细致的工程工作,才能让问答类产品回答能更准确。例如,问答类场景里,用文档的数据喂模型时窗口界面对文档的大小有限制。通常情况下不能一股脑把整个文档喂给模型,而是要采取切片的方式,让模型能一段一段去做阅读理解。切断的策略不一样,可能上下文的连贯程度就会有差异。
通过与企业在场景里的共创,钉钉的技术人员沉淀出了切片的策略经验。除此之外,钉钉的Chat AI解决方案团队还与共创的企业打磨了召回、相链等能力,通过相应的策略调整和大量综合性工程工作,让问答的结果能更准确,应用更为智能。
共创的企业也需要做细致的行业知识输入,来提升问答的准确性。不同于小模型时代针对专业领域的知识要做大量的标注工作,大模型时代的数据标注工作大幅减少。企业要做的是针对各类知识库和文档的专有名词的缩写做专门配置,例如,产品文档里的英文缩写指代的意义等需要企业去完成名词解释。“企业不需要去做完整的提示词工程,Chat AI解决方案尽量把一些复杂的逻辑和技术应用收掉,降低大模型的应用门槛。”王俊杰告诉数智前线。
经过几个月打磨,艾为电子的智能问答目前已经在官网上线小时更加及时准确的响应快的服务,能大幅提升用户满意度,同时还能解放一线
钉钉总裁叶军此前曾谈到,大模型甚至多模态的能力,能从一个实验室进入大众视野必须要经过一个高频应用场景。探索高频应用场景是接下来这个行业必须面对的一个情况。
无独有偶,比尔盖茨在最新的博客里也提到了无处不在的个人AI将在科技行业和社会中掀起一场“冲击波”。
智能客服和问答场景被业界认为是大模型能率先落地的场景之一。沙利文最新发布的《2023年中国智能客服市场报告》显示,2022年中国智能客服市场规模已达到66.8亿元,预计到2027年市场规模有望增长至181.3亿元,预计五年内复合增长率可达到20%以上。
目前,艾为电子和铁骑力士等企业与钉钉共创探索的数字员工和智能问答等都从业界认为更能落地的场景切入。钉钉自身的能力建设也抓住了贴近企业业务场景和应用等特征,着重从应用层发力。
钉钉的技术团队向数智前线介绍,目前与艾为电子和铁骑力士共创的应用场景,正在打磨形成一款名为Chat AI的智能解决方案。它包含了三类应用,一是面向企业数字资产的解决方案Chat BI,二是面向知识资产的Chat Memo,三是面向软件资产的Chat Form,支持一句话生成和提交表单。通过相对标准的应用层交付,一些不具备条件的企业可以不必从头开始训模型找场景。
“其实我们不喜欢通用模型”,熊峰说,作为一家主业为农牧业的大型企业,前沿的AI技术并非铁骑力士的强项。如何让前沿的大模型技术能够真正被用起来,熊峰和团队经历了几个月的摸索。通用模型在当前很难去解决企业业务的需求,铁骑力士尝试过智谱科技的开源大模型ChatGLM,按照自己的方式来训练一个本地部署的模型。
但铁骑力士在模型训练过程遇到了两个问题:一是大模型对硬件资源要求高,铁骑力士专门花了20万元,买了两台GPU服务器做训练,“效果相对满意”,但超过10个人同时在线就会很卡,而铁骑力士整个集团有数千人规模。熊峰算过一笔账,如果要完全满足需求,要投入200万元建基础设施。对于他们这种主业不是做AI的公司而言,风险很大。另外,开源的软件虽然不花钱,但模型本身还需要进行精调,需要专业且昂贵的AI人才。
另外,铁骑力士已经全员上钉钉,也给Chat AI的产品有了更好对接的机会。如果去采用第三方的大模型服务,要想将大模型的能力应用到业务流程中,意味着还需要想方设法与钉钉打通,而现在接入成熟平台的AI PaaS层能力,与企业内部的知识库结合,来提升已有场景痛点的产品体验是更合适的路径。
企业也看到,大模型应用初期产品和界面仍有待打磨和完善。例如,钉钉和企业的共创团队们就发现模型主动反问和确认问题,可能有助于提升回答的准确性。
智能问答有时效果不够理想,并非模型能力不行,有可能是用户描述的问题过于笼统。王俊杰介绍,人脑的工作原理是多步骤,但现在绝大部分大语言模型的交互都是单步骤,“未来这个能力会让智能水平大幅度提升。”
业界人士也普遍关注企业内应用场景里大模型如何克服幻觉问题。一位业内人士告诉数智前线,如果只是C端用户自娱自乐,准确性的要求往往不会太苛刻。但智能客服是严肃场景,给用户错误的信息会带来很麻烦的后果。艾为电子CIO陆轶透露,双方的团队也在持续迭代,给大模型产品提供更多的专业知识输入,让企业内的专业技术人员持续调试产品,保证智能客服产品回答更准确。另外,智能客服都会有一个托底方案,客户觉得没有满足需求,可以一键转人工客服。
熊峰还从业务闭环的角度提出了一些畅想。例如,智能问答当前更多停留在问答本身,尚没有与企业的业务流形成闭环。例如,一些客户进入问答界面,如果数据能与CRM打通,能够对用户身份有辨识,未来才形成对这些人群的针对性运营。在熊峰看来,将这些问答与客户数据做关联CQ9电子最新网址,与企业经营形成闭环,才能线
艾为电子CIO陆轶认为,“共创探索的初步成功,为我们进一步用AI技术,在数字化转型深入阶段赋能业务提供了很好的支撑”。下一步艾为电子希望利用AI进一步挖掘非结构化的数据资产的价值,同时让企业内结构化数据的提取变得更简单。另外,现在行业已经开始讨论AI Agent的应用,艾为电子也在思考未来与钉钉共创场景,利用数字员工去完成更多类任务。
而熊峰则看到,这一技术已经产生了一些意想不到的结果,例如发现企业内冲突的规章制度,把企业内部的一些管理问题暴露出来。
企业应用AI的能力在过程里则逐渐深化。叶军认为,大模型不只是有趣好玩的东西。“它能够和业务进行关联,能够在生产、供应、销售、设计、管理研发等等过程中把大模型真正应用下去,这样智能化才会有价值。”