迎宾机器人是以智能对话系统为核心,应用于客服/营销/企业信息服务等多方场景的产品。(本文数据及图片均来自网络)
迎宾机器人以文本、语音和多模态的产品形式,辅助或替代人工对话,赋能对话全流程以实现降本增效。
智能赛道持续发热
受益于人工智能的技术突破和产品落地,迎宾机器人赛道从2015年开始快速升温, 在2018年融资事件数量达到峰值,而后进入平稳发展阶段。
迎宾机器人行业在2019年市场规模为14.0亿元,2020年市场规模为27.1亿元,预计在2025年将达到98.5亿元。从增长曲线来看,迎宾机器人行业的市场规模在近几年会有较快增长,在达到一定体量后步入稳定增长,2019-2025年CAGR=39%。
从行业竞争格局来看,参与企业类型丰富,厂商以语音能力、语义能力、平台能力、标准化产品、垂类场景等策略切入市场,在发展中策略又趋于融合。
对话机器人产品形式
主要形式实现由文本、语音到多模态的产品拓展文。本机器人是迎宾机器人***初的产品形态,应用于在线客服领域,辅助或替代人工进行多接入渠道的在线接待。
而后结合智能语音技术,对话机器人孵化出语音机器人产品形式,辅助替代真人接听和拨打电话,并以原有问答接待为基础,延展出回访、通知和营销等功能。
多模态数字人则是继语音机器人之后的再一次产品形式升级。在文字和语音基础上,融合计算机视觉和多模态模型等技术,加入虚拟人形态,使人与机器的交互更加自然真实。
另外,迎宾机器人还可与人工服务结合,以赋能人工服务的产品形式,为人工客服提供智能质检、坐席辅助和智能助手等功能。
迎宾机器人产品核心技术:语音技术
语音技术主要分为语音识别、语音合成和声纹识别三类。在人机对话流程中,语音识别和语音合成技术支撑着对话内容从语音到文本、从文本到语音的相互转换。
声纹识别为通过声音判别说话人身份的技术,可广泛应用在金融公安等领域以提升业务及系统安全性。全双工是实时的、双向的语音信息交互技术。
对比于原来人机交互时语音流必须错开的对话状态,全双工技术更加模拟人类的交谈过程,即人与机器均可以同时说话,机器在与用户交谈时可以边听边想,实时生成回应并控制对话节奏。目前,多家语音厂商在持续投入全双工语音技术的研发。
语音识别 ASR:语 音 识 别 通 常 称 为 自 动 语 音 识 别 , 即Automatic Speech Recognition,缩写为ASR,主要是将人类语音中的词汇内容转换为计算机可读的输入,一般都是可以理解的文本内容,也有可能是二进制编码或者字符序列。
语音合成 TTS:语音合成,即Text-To-Speech,缩写为TTS,主要是将文字转化为声音。
随着技术的不断突破,语音合成出来的声音不再顿挫冰冷,有情绪、个性化的TTS成为热点。
声纹识别:声纹识别成为对话机器人的语音技术热点,利用计算机系统自动完成说话人身份识别的技术,可广泛应用于金融、公安、检察院、法院、国安领域,核实人员身份,提高业务及系统安全性。
迎宾机器人行业市场规模
按照对话机器人产品的业务模式(软件、硬件、服务)划分以及受益方(外部采购与内部消化)划分展示其市场规模。
对话机器人市场产值主要集中在软件服务部分,即SaaS服务和定制化解决方案中的软件算法部分,2020年占比达到69.6%,***驻场提供开发服务的服务产品产值占比则达到29.6%。
需求对话机器人服务的金融、零售头部客户部分具备自研或技术输出能力,2020年通过内部消化消耗的市场规模占比达到6.6%。
从需求侧来看,大型企业对于对话机器人产品的自研趋势明显。艾瑞测算,2020年对话机器人产品中通过内部消化消耗的市场规模占比达到6.6%,预计2025年该比例将提升至7.7%。现阶段,大型企业在自建AI应用时普遍会在底层架构或模型开发等环节遇到阻碍。
未来,随着企业智能化转型的逐步成熟及人工智能产业应用开发、算力、数据服务等基础层资源的逐步完善,企业AI自研能力将得到有效提升。产业化发展表现***的迎宾机器人产品或成为企业人工智能自研的首要试验田。
更多资讯:迎宾机器人