捷通华声灵云语音合成技术:让人机交互更有“温度”
来源: 时间:2021-12-03

  语言的多模态应用已成为人们生活中习以为常的现象,一句简单的语音控制、一次短暂的智能客服答疑……这些都是 AI 语音交互技术应用为人们生活带来的便利,与此同时,其社会价值与意义也在被重新估判......


  有 “温度”的声音


  语音技术主要分为语音合成(Speech Synthesis, 或者 Text to Speech)、语音识别(Speech Recognition, 或者 Speech to Text)、自然语言处理。其中,语音合成技术发展最早,且应用已较为普遍。


  “说”是人机交互无法忽视的环节,语音合成的重要性日益凸显。


  语音合成技术旨在通过将文字转化为语音,让机器“开口说话”使得机器变得有“温度”,实现趋于完美的人机交互。


  从早期的机械化语音合成开始发展至今,语音合成的应用场景经历了较大的转变。过去语音合成应用主要用于简单的文本播报,场景相对单调,现其应用场景更复杂更多样,智能助手、智能机器人、文字阅读等诸多领域都能见到语音合成技术的身影。


  如在有声阅读方面,用户需求越来越个性化;