InterPhonic(科大讯飞语音合成系统)是一款功能卓越的语音合成电脑应用。它提供中英混合文本的持续语音合成服务,并开放了语音合成服务的开发接口,以及其他与语音合成相关的特性。该系统采用先进的语音技术,并拥有专业的技术支持团队,使得用户不仅能够轻松实现语音合成,还能进行文本与语音之间的实时翻译,确保发音清晰、翻译精准。
InterPhonic以丰富的大词库和先进的语音节奏叙述体系为基础,提供面向任意文本、任意章节的持续语音合成功能。生成的音色逼真,可媲美真人发音,支持普通话、粤语、英语等超过十个语系,包括业内领先的普通话与英语、粤语与英语同音词混读,并且已经经过了大规模实际应用的考验。
高品质语音合成:将键入文本即时转换为流畅、清晰、自然且富有感染力的语音数据。
多语服务:融合多语语音合成模块,提供汉语、中英混读、英语、粤语等语言的语音合成服务。
高精密文本分析技术:确保对文本中的未知词汇、多音字组词、特殊字符(如标点符号、数据)以及韵律语句等进行分析和处理。
多编码支持:适用GB2312、GBK、Big5和UTF-8等多种编码,支持一般文本和含有CSSML标签等多种格式的文本信息。
多种输出格式:支持输出多种格式的语音数据,如线形Wav、A/U率Wav和Vox等。
灵活的接口:提供标准接口、简易接口、COM接口、SAPI接口,便于在各种自然环境下进行系统集成。
语音调节功能:开发接口提供声音、声音速度、音准等多种生成参数的动态调节功能。
配置和可视化工具:生成模块提供统一的配置和管理工具,实现全局参数配置、用户字典、用户标准、定制资源包管理等。
效果提升:生成模块提供以定制资源包和CSSML为代表的多种针对实际应用场景进行效果提升的方式。
一致的浏览方法:支持以Client/Server方式浏览远程语音合成服务,并提供与本地启用相同的开发接口,实现完全透明的浏览。
动态web服务:提供动态web服务模块,以对客户透明的方式动态配置多台语音合成服务器的资源。
环境音和预音频:生成系统还提供环境音和预音频功能,满足不同场所的应用和人性化需求。