专利名称:一种机器翻译方法和装置专利类型:发明专利
发明人:邢启洲,李健,张连毅,武卫东申请号:CN201811354641.1申请日:20181114公开号:CN109492233A公开日:20190319
摘要:本申请提供了一种机器翻译方法和装置,所述方法包括:获取用于训练神经网络模型的训练语料,所述训练语料包括多个不同长度的文本字符串;根据所述多个不同长度的文本字符串各自的长度,将所述训练语料分为至少两个训练语料组,一个训练语料组包括的多个文本字符串的长度在预设长度范围内,不同训练语料组包括的文本字符串的长度在不重叠的预设长度范围内;以所述至少两个训练语料组为训练样本,对所述神经网络模型进行训练,以得到翻译模型;获取需要翻译的目标文本字符串;利用所述翻译模型对所述目标文本字符串进行翻译,以获得结果文本字符串。在翻译模型训练过程中不需要填充大量的PAD辅助词,提高了翻译模型的训练效率。
申请人:北京捷通华声科技股份有限公司
地址:100193 北京市海淀区东北旺西路8号中关村软件园2号楼A座一层2101
国籍:CN
代理机构:北京润泽恒知识产权代理有限公司
代理人:莎日娜
更多信息请下载全文后查看
因篇幅问题不能全部显示,请点此查看更多更全内容