本文着重于客户服务中心海量数据现状,结合数据的存储、分析需求,以数据收集、数据存储、数据分析、数据服务等四项关键步骤,对服务数据采用分布式分析方法,分别对文本数据、语音数据、舆情数据等进行深度平台化加工,进而设计与搭建具备实践性价值的数据体验平台。
前言
大数据作为计算机科学与技术发展与应用的一个重要方向,也是“互联网+”的重要组成部分之一,其应用一直是诸多企业在提升自身技术应用能力与水平的关键。大数据应用不仅仅是一种数据化的集合,更是一种新的处理模式及优化模式。
客户服务中心需要处理大量的客户咨询、投诉等业务,在处理业务的同时,其数据规模也在不断扩大,随着服务模式和渠道的增加,数据种类日益增多。在数据类型上,有服务数据(多媒体信息,包括文本和语音)、客户数据,还有系统运行数据、其他在服务过程中收集的数据等,利用好这些数据,不仅可以进一步提升客服中心的运营能力,还可以结合人工智能数据的应用,驱动智能数据产品,为前端经营发展助力。
一、国内外应用现状
国外对客服中心数据体验平台的研究起源较早,早在20世纪30年代,北美在快速的经济发展中就已经形成了在旅游业、民航业的呼叫中心模式,最早的呼叫中心主要是是以预定服务为主,更多依靠硬件支持,很少有软件服务支持。随着用户需求量的高速增长,20世纪50年代,美国部分企业开始设立具有一定规模的呼叫中心,以全天候服务的方式开展预定业务,而后几十年间,呼叫中心伴随着银行业、电商行业的快速发展,规模不断扩大。
国内的呼叫中心起步相对较晚,20世纪90年代开始在电信领域兴起,早期规模较小。直到本世纪初,呼叫中心开始被国内越来越多的企业开始重视,并逐步作为企业发展、产品推广的重要工具,其功能细分也更为明确。2010年后,云计算服务开始应用到客服中心中,云呼叫中心的产品在理论上是可以支持更多座席(甚至是无限座席)。在运用开源数据、分布式文件系统的计算框架模式下,一些高性能数据方法开始逐步被应用及测试,例如:Hadoop模式,以高扩展性功能获取更多的存储空间。
二、数据体验平台需求分析
1总体需求与角色需求
在角色需求层需要综合考虑系统、运营、质量考核、数据分析等管理职能,系统管理需要以运营监控为导向,运营需要更多关注服务人员的运营质量,形成全方位、立体化的运营监控模式。
对于质量考核而言,数据体验平台需要明确坐席服务质量监控、质量考核的标准,以明确的质量考核标准形成立体化的服务监督标准。数据分析的需求在运营监控、质量监控的基础上,形成数据分析库及功能,定向分析结论。系统管理则是数据体验平台的最高权限者,除了基础的业务分析职能,还需要起到系统信息管理、数据管理、权限管理等功能。
2功能需求与非功能需求
一是体验数据的收集功能,将业务平台、语音平台、在线平台、舆情平台的数据进行抽取、加载,形成实时处理数据,在线或离线处理。
二是体验数据的分析功能,这一功能需求包含座席、系统的运营情况,也是分为实时、离线功能,其包含座席话务统计分析、IVR分析、座席服务分析、满意度分析、投诉分析等。
三是体验数据的服务功能,该需求主要是一些报表服务、线上服务、存储服务等,按照平台化开放的方式面向运营侧人员生态数据报表,供分析运用。
这里需要明确的是,由于客服中心每日服务语音和多媒体交互内容存储数据巨大,数量也在不断增长,需要评估对语音数据进行文本化转换后存储、图片数据进行去重,也有利于减轻数据体验平台的存储压力。
非功能性需求主要包含如下两点:
一是稳定高效性功能需求,其主要包含分布式数据以及系统的稳定性,尤其是对于数据需求方而言,这一功能尤为关键,如出现数据丢失等情况,不仅导致数据分析无法进行,更会造成无法估量的经济运营损失,因而首先要考虑稳定高效的功能需求。
二是扩展性需求,其主要是在系统测试、试用阶段,按照业务复杂度、数据接入度的要求,以资源扩充为导向,在满足业务资源的同时将动态存储、计算功能进行扩展,进而不断提高系统存储能力及功能应用能力。
三、客户服务中心数据体验平台设计分析
1数据体验平台收集模块设计
在收集功能上,还需要充分考虑到系统设计的应用、结构等,在系统展示上按照应用、计算分析、数据存储、接入、数据展示等收集方式,收集展示中涉及到系统管理、运营分析、质量考核等可视化操作模式,需要将其结果展示到系统层的用户群体中。
收集模块的应用还需要考虑到分布式的解决方案,海量存储因为要涉及到实时的查询功能,这一功能下可应用HBASE技术,按照非结构化数据的存储方式进行分布式收集处理。按照数据接入层的抽取需求及规则方式,实现结构化、非结构化的数据平台应用,将语音数据上传,形成数据平台数据库集。
2数据体验平台分析模块设计
在具体的分析模块设计上,还有一项重要的职责就是应用服务层的数据计算分析服务,其主要是在Spark离线计算、Spark Streaming实时计算、语音识别等基础上,实现语音与文本的双重挖掘。
3数据体验平台服务模块设计
数据库(HBase)按照索引数据查询方式,应用到数据相对较小的数据库中,数据功能相对单一。
不过,两者的功能都需要建立在分布式的文件系统层上,这也是服务模块设计的关键。
1、以传输导向的收集模块搭建
在客服中心自身已经搭建的话务、业务平台上,先建立数据库记录模式,对通话的数据进行详细的记录,其包括时间、排队等信息,这些数据信息可以满足现阶段的服务需求,还可以形成集群的数据收集方式。
例如:数据收集中,MySQL语句汇总的binlog日志就有三种模式以上,行动记录及对数据库的备份功能都是极具收集效果的。还有一种row模式,主要是对数据库执行准确的备份,包括存储过程、触发等数据,都是一种很好的解决方式,同时也很灵活。值得一提的是,现在一些大型的平台也会有开源组件,例如阿里巴巴集团的开源Canal,这些组件也可以在API接口下进行便捷的应用。
2、以计算导向的分析模块搭建
在现有的条件下,座席指标包括对接通率、呼出成功率、服务水平、满意度等指标进行分析总结。对最终的运营数据及分析结果均可以按照实时计算、离线计算的方式,对最终的数据采取、分析、存储等都会起到很大的作用。
在这一过程中,实时分析设计与实现按照Hive的实践方式,同步数据管理功能,数据库使用SQL功能操作,信息数据、关系数据等在无法满足存储需求的基础上,将数据转移应用到更大的数据平台功能上,从而提升其大数据存储及关系型数据库的开发功能作用。在文件数据源的基础上,源操作包括功能操作、数据表等,不同数据源创建的临时表操作模式也是不同的,也需要更多的兼容功能及高性能的数据运行能力。
3、以存储导向的服务模块搭建
后者在文件存储服务设计及实现上,其主要是文件管理功能,在存储的基础上,按照文件管理创建、删除、检索等功能,以文件ID映射的方式进行识别,所有的HDFS都是在同一目录层级下,功能创建及搭建更为简单,且支持多级目录的创建及应用。
总结
随着国内很多企业客服中心规模及需求的扩大,其在涉及数据体验平台设计及搭建需求主要有如下三个方面:
一是对数据存储空间及数据处理要求不断增大,甚至对云数据存储及功能应用也提出了更高的要求。
二是在结构化、非结构化的数据应用层,无论是语音数据,还是一些难以实现结构化的文本数据,其均存在巨大的数据存储、处理、分析的问题点。
三是平台化数据处理机制的匮乏,这一问题不仅仅体现在T量级的数据处理上,数据丢失、分析问题也会在一些开源模式下应用更多的技术功能。
为此,需要通过云服务功能及大数据处理功能,进一步解决数据存储、结构数据应用、平台数据处理机制等三大核心问题,进而为客户服务中心综合体验能力的提升提供更多数据化的功能基础。
编审评注
其在服务过程中的很多信息都值得企业记录并加以挖掘分析,并在后续的产品改善、营销策略制定和提升客户满意度美誉度方面都有很大的应用前景。而采集、存储、分析和应用就是需要客服中心在考虑成本产出比最优的前提下,让服务数据得以最大化的利用,而这些的前提是企业和呼叫中心的领导是否已经想明白服务数据对企业的作用,以及如何做好数据产出、使用的闭环。
至于采取何种技术和解决方案,则是在决策层想清楚大战略方面之后,就容易选型确定。拎着锤子找钉子却是当下一些迫切想将服务数据增值化操作的呼叫中心的典型场景。——张辉