一、从双语语料库中获取汉英翻译规则的研究(论文文献综述)
头旦才让[1](2021)在《汉藏神经机器翻译关键技术研究》文中指出机器翻译是利用机器将一种自然语言转换为另一种自然语言的过程,它是计算语言学的一个分支,涉及计算机技术、数学、认知科学、语言学、信息论等多门学科的交叉和联系,是人工智能的终极目标之一。汉藏机器翻译相关技术的研究,对于继承和弘扬民族优秀文化,增进文化交流,寻求思想的沟通,服务国家一带一路倡议,推动我国藏族地区社会、经济、教育和文化事业发展等有着十分重要的现实意义;能够促进藏语计算语言学的实质性发展,具有非常重要的科学研究价值和实际应用价值。本文在通过构建高质量和内容丰富的汉藏双语平行语料库的基础上,对藏文长句分割技术、藏文地名识别技术、改进藏文字节对编码等关键技术进行了初步探索,力图通过优化汉藏神经机器翻译模型来提高翻译性能。具体而言,本文的研究内容主要包括以下几个方面:(1)语料库预处理方面:本文重点研究了藏文长句分割技术,归纳藏语句子边界识别规则,找出句子边界识别的难点,提出了融合藏语依存句法和基于Bi-LSTM(Bi-Long Short-Term Memory)+CRF(Conditional Random Fields)的藏语长句子分割方法,对藏语长句进行了分割,实验表明,该方法有效地分割了藏文长句,F值达到99.42%。(2)藏文命名实体识别方面:本文重点介绍了藏文地名识别技术,阐述了藏文地名的音节、触发词、地名后续词和格助词等特性适用基于CRF模型的地名识别。实验结果表明本文方法对藏文地名识别的准确率、召回率和F值分别达到了96.12%、81.92%和88.45%。为处理藏文地名词,本文在训练语料分词中融入了藏文地名识别技术,BLEU值达到30.46,提高了汉藏命名实体翻译的效果。(3)模型改进方面:本文通过改进字节对编码算法,提出了带字数阈值的藏文字节对编码算法,优化了基于注意力机制的汉藏神经机器翻译模型。收集整理了100万汉藏句对和20万汉藏人名地名词典,训练了汉藏神经机器翻译模型。通过测试和验证,模型的BLEU值达到36.84。本文构建的模型的命名实体翻译效果要优于已商用汉藏在线翻译系统。(4)系统改进方面:设计实现了基于注意力机制和改进字节对编码的汉藏神经机器翻译系统,优化了后端流程和程序,部署在阳光汉藏机器翻译网站,实现了阳光汉藏神经机器翻译系统V2的应用推广。
童富智[2](2020)在《基于语料库的《政府工作报告》日译文本翻译语言特征研究》文中认为本研究以语料库翻译学理论作为研究框架,以2004年度至2018年度《政府工作报告》汉语原文、日语译文以及与报告文本类型相近的日语原创文本作为语料,自建专用语料库,使用以语料库法、问卷调查法为代表的实证研究法、比较法等研究方法,通过探讨翻译共性、具体语言对翻译语言特征,考察《政府工作报告》日译文本的翻译语言特征问题,具体体现为分析翻译语言的词汇、句法、搭配和语义韵等方面的特征。政府工作报告日译文本的词汇特征表现在词汇的总体特征、词汇的应用特征两个方面。研究表明,作为词汇的总体特征,报告日译文本词汇的类符/形符比值、词汇密度值高于文本类型相似的原创日语参照语料,反映出报告日译文本词汇的变化性较大,词汇应用相对复杂;报告日译文本的词汇出现次数分布均值低于日语参照语料,反映出日译文本词汇变化的多样性特征;报告的译文和原文前20位高频词呈现较高的对应关系,频率接近,存在词类活用的转换现象,表明译词有效传递了原文信息。词汇的应用特征表现在受原文影响,在日译文本的词汇中,含有略语、比喻、专有等典型的表达结构,具有相似的共性特征。对略语结构中的数词略语结构,本研究进一步探讨了其日译特征,以翻译方法为切入点,探讨数词略语日译词汇的分类并分别探讨了各类数词略语的日译特征,对部分类别提出了规范性的日译方法。研究表明:报告日译文本的词汇呈现“显化”和“简化”的翻译共性特征,可以概括为:“语义显化”和“形式简化”。“语义显化”具体可分为:所指语义显化、功能语义显化;“形式简化”具体可分为:概念延续性形式简化、概念构成性形式简化。政府工作报告日译文本的句法特征表现在句法的总体特征、典型语句结构应用特征两个方面。研究表明:在句法的总体特征方面,报告日译文本和日语参照语料的平均句长值相近,具有相似的句法特征,反映出报告日译文本的表达符合日语母语的表达习惯,能够起到良好的受众阅读效果。在典型语句结构应用特征方面,报告日译文本中,动词连用形联接分句的结构符合日语语言特征,可以传递报告原文分句间内含的语义逻辑关系信息。研究表明:报告日译文本的句法呈现“范化”的翻译共性特征。作为前沿问题探索,本研究以政府工作报告中实义动词“坚持”及其日语对应词「坚持(する)」为例,探讨了基于语料库的配搭和语义韵研究问题。研究发现,数据显示两词分别在相应的语料库中与搭配词形成不同的共选型式,两词分别形成的短语序列在形式、意义和功能方面虽有部分重合,但差异明显,指向不同的语义韵。研究表明,汉日短语的应用具有各自的形式、意义特征,政府工作报告的词汇日译研究还需将功能作为考量标准。在研究总结的基础上,本研究提出了中央文献日译标准体系的对策思考。
张冠东[3](2020)在《英汉双语术语自动抽取工具效率对比实验报告》文中研究表明高效的计算机辅助翻译在很大程度上取决于高质量的翻译记忆库和术语库。双语术语自动抽取是构建大规模双语术语库的关键步骤。探讨双语术语的自动抽取方法、完善现有双语术语自动抽取工具成为计算机辅助翻译研究的重要内容。本研究以“海上安全英汉平行语料库”为实验语料,通过双语术语抽取实验的方法,对目前计算机辅助翻译领域常用的三种英汉双语术语抽取工具SDL Multi Term Extract 2019、Sketch Engine One Click Terms和Synchro Term抽取结果的准确率、召回率和F值进行对比分析。在此基础上,进一步探讨了所抽取术语的翻译方向、术语的长度以及术语在语料库中出现的频率三种因素对每一种工具抽取效率的影响。实验结果表明,三种工具抽取英-汉双语术语的综合效率高于汉-英双语术语。就具体的工具而言,Synchro Term的综合抽取效率最高,SDL Multi Term Extract2019次之,Sketch Engine One Click Terms最低。抽取不同长度和不同频率的双语术语时,Synchro Term整体抽取效果最好,SDL Multi Term Extract 2019和Sketch Engine One Click Terms仅在个别长度和频率段的术语抽取时呈现优势。本实验结果将为译者或者翻译团队选择双语术语抽取工具时提供参考,并为双语术语抽取工具的优化升级提供一定的方向。
祖力克尔江·司坎旦尔[4](2020)在《汉语-维语双语词汇资源库构建方法研究》文中研究指明机器翻译以及汉语学习现已成为热门研究领域。词汇平行资源库构建作为机器翻译研究的基础之一,是本文研究的重点。本文结合目前流行的双语平行语料库构建方法,在此基础上提出了结构化的分段、分句、分词的汉语-维吾尔语双语平行词汇资源库构建方法。本文用爬虫程序在天山网上爬取大量汉语新闻语料,对原始语料进行除噪去重等处理,并利用分词系统进行分段、分句、分词形成结构性存储单语词汇语料库;采用机器学习方法,构建汉语-维吾尔语词汇翻译模型,将爬下来的词汇先跟20万条双语词汇语料库进行匹配,模型无法匹配的部分词汇,提交给搜索引擎模块,该模块在网上查找第三方翻译资源;查到第三方翻译资源后,采用翻译插件技术对结构性存储词汇语料进行自动翻译、对齐,形成准双语平行语料库;最后对插件翻译软件无法处理的部分采用人机互助的方式处理,形成新的标准双语平行词汇库;并使用双语词汇翻译模型,不断完善标准双语平行词汇库。本文重点研究基于插件的翻译技术,包括自动读取、翻译、对齐,写入对齐词表,自动构建双语平行词汇库。在研究过程中,利用爬虫技术、搜索引擎技术、插件技术、翻译技术解决了双语平行词汇语料库的构建问题。在双语平行词汇资源库构建过程中,以20万条汉语-维吾尔语双语词汇语料库作为模型学习的基础,使用爬虫程序在天山网上爬取的汉语新闻语料,通过汉语分词处理系统形成大量汉语词汇语料库。本研究最终以100万条汉语词汇作为研究对象,利用搜索引擎技术及插件翻译器进行对齐工作,经过对准双语平行语料库中插件翻译软件无法处理的部分采用人机互助的方式处理,不断让模型学习,实现自动对齐功能。本文利用爬虫技术、汉语分词技术,构建了比较规范的汉语单语词汇库。以汉语词汇库作为对齐对象,探索双语词典构建和插件翻译结合的双语词汇对齐模型,解决汉语-维吾尔语双语词汇对齐问题。为进一步开展短语对齐和词汇为单位的汉语-维吾尔语机器翻译系统的研究、开发提供技术及资源支撑。本文创新之处是融合爬虫技术、汉语分词处理技术、搜索引擎技术,研发插件翻译技术,实现汉语-维吾尔语双语词汇对齐模型,探索大规模汉语-维吾尔语双语词汇资源库构建方法,为下一步开展高质量的汉语-维吾尔语双语翻译模型工作提供技术、资源支撑,解决开展汉语-维吾尔语双语机器翻译中双语资源稀缺问题。
慈祯嘉措[5](2020)在《贫语言资源条件下的藏汉(汉藏)机器翻译关键技术研究》文中研究说明随着深度学习在自然语言处理研究中取得突破性进展,机器翻译技术也发生了革命性的变化,被广泛应用于人们的生活和工作中。我国作为一个统一的多民族国家,党和政府高度重视少数民族自然语言处理。近年来,我国少数民族自然语言处理相关技术蓬勃发展,尤其是藏语自然语言处理,更是随着科学技术的发展不断地在进步。不论基于统计还是基于神经网络的机器翻译方法,都需要具备大规模的双语或多语语言数据资源作为支撑,对于藏语相关的藏语自然语言处理研究而言,依然存在着数据资源稀缺、理论基础薄弱和技术方法不够成熟等问题,本文希望通过藏汉语言数据资源构建、单语语言模型融合、迭代式回译策略的应用以及跨语言模型预训练等理论和方法的研究,为贫语言资源条件下的藏汉机器翻译提供一个有效的研究思路,同时缓解目前藏汉机器翻译中资源稀缺、翻译性能不理想等问题,为藏区经济社会发展提供语言互译的技术支撑。本文的主要工作和创新点总结如下:针对藏汉语言数据资源匮乏问题,本文提出了一种面向藏汉机器翻译的语言资源构建技术,并构建了一个基于人民日报(藏文版)的藏、汉单语语料库和藏汉双语平行语料库。本文首先使用基于Web的大规模资源获取技术收集藏语单语新闻语料,并通过CNN+Bi-LSTM+CRF的藏文分词技术和Bi-LSTM+CRF的命名实体识别技术识别藏语新闻中的时间、地点、人物、组织机构等命名实体,并将其进行粗翻译,得到对应的汉语命名实体,然后通过汉语命名实体匹配到相对应的汉语新闻并将其进行预处理,通过篇章特征集合的相似度计算和基于Bi-LSTM+Attention模型的跨语言句子相似度计算,对藏汉两种语言的新闻文本进行篇章对齐和句子对齐,最终构建一个具有53.834万句藏语单语、61.759万句汉语单语和53.762万句对的藏汉双语平行语料库。针对藏汉机器翻译中双语平行语言资源缺乏,而藏汉两种语言的单语数据较为丰富的问题,为有效利用资源丰富的藏语单语数据以提高藏汉神经网络机器翻译的性能,本文提出了一种融合单语语言模型的藏汉机器翻译方法。本文首先通过循环神经网络语言模型建模的方法构建藏语单语语言模型,并将其与翻译模型的解码端预输出进行融合处理,利用浅层融合和深层融合的方式,将翻译模型生成的词和语言模型生成的词重新进行加权排序,使源语言与目标语言产生映射关系,最终输出目标语言。通过这种融合单语语言模型的藏汉机器翻译建模方法,可有效提升贫语言资源条件下的藏汉机器翻译的性能,经实验,这种方法在相同资源条件下,比原有的Transformer基线系统提升了3.4(藏-汉)和4.7(汉-藏)个BLEU值。针对贫资源条件下藏汉机器翻译性能不佳的问题,提出了一种迭代式回译策略的藏汉机器翻译方法。本文首先通过资源构建技术和实验室原有数据资源构建一个Transformer初始系统,对较大规模的单语语料(正向)进行翻译,得到源端是正确的句子,目标端是翻译生成的句子,然后通过平行句对过滤机制构建具有较强监督信息的伪藏汉双语平行语料,将其加入到翻译模型的训练中,然后进行回译(反向),通过相同的方式得到目标端是正确的句子,而源端是翻译生成的句子,经多次迭代实验,在初始系统原有的性能指标上,提升了6.7(藏-汉)和9.8(汉-藏)个BLEU值。针对藏汉平行数据资源规模和领域受限,对监督式神经网络机器翻译模型的适应性较差的问题,提出了一种跨语言模型建模的藏汉机器翻译方法。本文首先构建了一个以Transformer为基线系统的藏汉机器翻译系统,通过对藏、汉掩码语言模型的预训练和藏汉跨语言翻译模型的建模,建立了富资源(汉)和贫资源(藏)之间的映射关系,然后将带有详细的语言信息和位置信息标签的藏汉双语句子以文本流的形式作为输入,通过这种预训练方式优化基线模型的性能,经实验表明,BLEU值分别提升了8.1(Transformer Base+MLM和Transformer Base)和5.7(Transformer Base+MLM和SMT)。本文一方面通过对藏汉语言资源构建和相关技术的研究,构建面向藏汉机器翻译的语言资源库,另一方面通过研究贫语言资源条件下的藏汉机器翻译理论和方法研究,优化和改进藏汉机器翻译的性能,取得了一些成果,为今后藏汉机器翻译研究提供了一个可借鉴的思路和方法。
史洁[6](2019)在《目的论指导下的科技文本汉英翻译实践报告 ——以《计算机辅助翻译》为例》文中提出在当前信息化高速发展的时代,随着科技的不断发展与全球经济一体化的逐步深入,英语作为全球用语言,英语翻译的重要性日渐提升。科技英语翻译由于其专业性,要求科技翻译从业人员在对科技英语文本特点了解的基础上,提高科技英语的翻译技巧。德国功能派翻译理论家Katharina Reiss和Hans Vermeer提出翻译目的论,详细阐述了目的论的基本原则,即目的原则(skopos rule)、连贯原则(coherence rule)和忠诚原则(fidelity rule)。其中目的原则是首要原则,连贯原则和忠诚原则需忠于目的原则。本翻译实践报告选取钱多秀主编的翻译专业教材《计算机辅助翻译》第一、二、三章为原文本,在翻译目的论指导下,将原文本译为英语。实践报告由五部分组成,分别为翻译任务描述、翻译过程描述、翻译理论概述、案例分析和翻译实践总结。其中案例分析是本实践报告的核心部分,重点在于体现翻译思路,说明翻译方法;翻译实践总结部分则是实践报告的精华部分,体现了翻译实践的收获和意义,为未来的翻译工作提供建议。通过撰写本翻译实践报告,译者不仅在翻译水平上得到一定的提高,学习了一些计算机辅助翻译软件的基本操作和使用技巧,而且增进了对翻译的认识,更加意识到好的译者不仅需要具备过硬的专业素质,还应与时俱进,不断学习新的翻译技术——计算机辅助翻译。
梁继文[7](2019)在《基于多模型的先秦典籍汉英平行语料句子对齐研究》文中研究指明在多语言和跨语言的信息处理等自然语言处理任务中,双语平行语料库起着重要作用。近年来随着数字人文研究的开展,以及“中华文化走出去”战略的实施,典籍双语平行语料作为文化传播的主要载体,为跨语言典籍检索系统与跨语言人文计算研究提供底层数据支持。其中句子级别对齐的双语平行语料库可提供更为有效的序化信息,同时句子对齐的质量对开展后续跨语言检索系统构建、知识提取等研究影响较大。句子对齐即实现双语文本句子级别的语义匹配,它除一句原文对应一句译文这种最简单的情况外还包含多种对齐模式(如一句原文对应两句或多句译文),因此实现自动句子对齐较为复杂;同时因为先秦典籍双语平行语料存在一定特殊性,这更为古文-英文句子对齐增添难度。本文以先秦典籍汉英句级平行语料库的构建与跨语言信息处理为背景,以实现先秦典籍双语平行语料中的古文-英文句子自动对齐为目的进行研究,主要围绕以下几方面展开:1.段落级别先秦典籍双语语料库的构建人工获取网络先秦典籍双语资源,并通过半自动化的方式构建段落级别对齐的典籍双语平行语料库。基于获取到的段落对齐的双语语料,进行句子划分后进行人工双语句子对齐,共生成典籍古文-英文对齐句对13700对。2.先秦典籍古文-英文句子对齐方法选取及特征抽取本文选用基于长度和词汇相结合的方法,将分类思想引入双语句子对齐研究中。通过分析古文和英文的语言特点与句法结构,结合现有研究综合提取出四个古文英文对齐句对特征,其中包括句子长度特征、对齐模式特征、标点符号特征以及关键词互译特征。选取句子对齐语料中的《论语》《礼记》语料,共含对齐句对5941对,生成候选句对集(包含对齐句对与非对齐句对)共36728个双语句对作为实验语料。使用提取到的特征,训练双语语料并为每个候选句对分配统计得分,假设每个句对的概率独立并计算概率最大值。3.先秦典籍古文-英文句子对齐模型构建首先基于人工抽取的特征,使用监督学习从“序列标注”与“整体分类”这两种对齐句对识别的角度进行实验。进行对比后最终选取句子对齐效果最好的LSTM-CRF模型,F值为92.67%,并基于此进行特征融合实验,最终提出了有效适用于古文-英文句子对齐的方法。随后探索无需进行人工特征抽取与计算的方法,基于Doc2vec自动获取的双语语义特征进行对齐研究,并在使用LSTM模型时效果较好。
聂男(NYIANU NOULAO)[8](2019)在《以泰语为枢轴的老—汉双语语料库构建方法研究》文中提出老-汉双语语料库是开展汉-老机器翻译及跨语言检索的重要数据资源,老挝语是东南亚语言中资源较为稀缺的语言,老-汉双语平行资源较为稀缺,直接从互联网上获取老-汉双语平行资源存在较大困难。老挝语、泰语是较为相似的语言,汉-泰双语资源相对较丰富,为此,论文利用泰语、老挝语语言相似的特点,提出一种以泰语为枢轴语言的老-汉双语平行语料库构建方法,实验证明提出的方法对老-汉双语语料库的构建具有一定的理论意义和实际应用价值。论文的研究工作主要体现在以下几个方面:1.利用网络爬虫技术从汉-泰双语新闻网站、维基百科、汉-泰双语学习网站自动获取了一定规模的汉-泰双语平行语料库,并通过人工的方式对数据进行校对,构建了汉-泰双语句子对齐语料库及老-泰双语句子对齐语料库,分析了老挝语、泰语在构词、读音、句法等方面的语言相似性和差异性。2.提出了一种以泰语为枢轴语言的老-汉双语语料库构建方法,该方法首先从已构建的汉-泰双语句子对齐语料库中选取泰语句子,利用老-泰双语词典将泰语句子翻译成老挝语对应的词序列作为候选的老挝语句子,然后通过训练老挝语神经语言模型对候选的老挝语句子进行校正,最后利用卷积网络和双向LSTM构建老-泰双语平行句对分类模型,提取老-泰双语平行句对,以泰语为枢轴语言构建老-汉双语平行语料库。实验证明提出的方法的模型精确率达到了72.62%,召回率达到了70.02%。3.基于Tensorflow平台构建了老-泰双语平行句对抽取模型,基于Java EE技术研发了基于以泰语为枢轴的汉-老双语语料库构建原型系统。
汪云,周大军[9](2017)在《基于语料库的机器翻译的现状与展望》文中提出机器翻译是探索如何借助计算机程序将文字或语音从一种自然语言翻译成另外一种自然语言的技术。早期是从自然语言学的角度研究机器翻译,产生了基于规则的机器翻译系统。上世纪80年代末以来,针对传统机器翻译的不足在基于规则的技术中引入了语料库方法。与翻译有关的语料库有三类:平行语料库、多语语料库和可比语料库。基于语料库的机器翻译主要包括基于统计的方法和基于实例的方法。前者强调从数学上建立统计模型,后者主要是从机器学习的角度通过翻译实例进行推理。基于语义的方法将会成为统计机器翻译未来发展的趋势;而融合各种学科理论和技术的最新成果,进一步建立和发展多模态语料库,则是开发基于语料库的机器翻译系统的发展前景。
傅伟锋[10](2017)在《基于语料库的汉英程度副词比较研究》文中研究表明近几十年来,学界对汉语程度副词的研究越来越深入,且成果丰硕。但总而言之,对汉语程度副词的研究基本局限于单语言维度下,且更多的是集中于某些个体的研究,缺乏系统性,这种现况对于对外汉语教学来说是相当不利的。所以我们有必要通过对汉英程度副词进行系统的梳理,全面的分析,发现两者之间的异同,特别是其中差异之处,这有助于我们进一步深刻认识汉语和英语教学语法的特点,建立一套既系统又科学和实用的汉英语法体系,以此丰富汉英程度副词比较研究。也将大大促进我国的汉语教学、对外汉语教学、英语教学及翻译事业,从而更好地促进国际交流。论文由九大部分组成:第一部分是绪论。介绍了选题的基本缘由、研究意义、研究现状、研究方法及研究框架,其中研究现状阐述了汉英程度副词总体研究情况以及比较性研究现状。第二部分是汉英程度副词对齐语料库的建立。在这一部分,我们以北京大学双语语料库为基础,对封闭的100个汉语程度副词一一进行检索,建立了一个小型的“汉英程度副词对齐语料库”,然后在此基础之上进行语料检索,形成了四个对比语料:“汉语程度副词+名词”语料;“汉语程度副词+形容词”语料;“汉语程度副词+动词”语料;以及若干以英语程度副词为条件进行的检索形成的语料。这些语料的形成为后续的研究提供了语料基础。第三部分为语料库建立后的初步研究。以极低频汉语程度副词与对应英语程度副词为研究对象,通过对单、双音节汉语程度副词与英语程度副词在对译语料中语义和语法层面的比较,初步地揭示了部分汉英程度副词的差异,为后续的研究提供了一定的分析基础。第四部分对汉英程度副词的程度量进行了比较,包含了程度量等级实现方式以及量级等级比较。主要研究汉英程度副词修饰形容词、动词的情况,修饰名词因在对译语料中出现情况极少,只做描述性分析。第五部分研究了汉英程度副词修饰动词时的制约机制,包含了语义制约以及句法制约两个层次,其中句法制约上是从动词有界/无界角度切入来探究受到句法制约的因素。第六部分比较了汉英程度副词否定形式在对译语料中的情况,包含否定形式的比较,以及否定语义指向比较两个层面。第七部分比较了汉英程度副词作补语时在对译语料中的异同。包含了句法单位、句中位置以及语义指向三个层面的研究。第八部分为汉英程度副词重叠的比较。简要地比较了汉英程度副词重叠的形式以及语义。最后一章为结论,对前文每一章研究成果进行了梳理和总结,并进行了一定的评述。文章在研究中采用了多种方法相结合。在理论方法上,主要以对比语言学理论和搭配理论为基础,采用对比研究的方法进行研究。但处于对比环境下对于一些组合难以做出有效地解释,因此为了解释一些语料现象,还引入了普遍语法理论作为分析理论,以解释这些问题。对于其它一些难以解释的部分,我们运用了语言类型学理论。实证方法上,采用的是语料库分析方法。通过对真实语料的分析,以挖掘汉英程度副词的异同。
二、从双语语料库中获取汉英翻译规则的研究(论文开题报告)
(1)论文研究背景及目的
此处内容要求:
首先简单简介论文所研究问题的基本概念和背景,再而简单明了地指出论文所要研究解决的具体问题,并提出你的论文准备的观点或解决方法。
写法范例:
本文主要提出一款精简64位RISC处理器存储管理单元结构并详细分析其设计过程。在该MMU结构中,TLB采用叁个分离的TLB,TLB采用基于内容查找的相联存储器并行查找,支持粗粒度为64KB和细粒度为4KB两种页面大小,采用多级分层页表结构映射地址空间,并详细论述了四级页表转换过程,TLB结构组织等。该MMU结构将作为该处理器存储系统实现的一个重要组成部分。
(2)本文研究方法
调查法:该方法是有目的、有系统的搜集有关研究对象的具体信息。
观察法:用自己的感官和辅助工具直接观察研究对象从而得到有关信息。
实验法:通过主支变革、控制研究对象来发现与确认事物间的因果关系。
文献研究法:通过调查文献来获得资料,从而全面的、正确的了解掌握研究方法。
实证研究法:依据现有的科学理论和实践的需要提出设计。
定性分析法:对研究对象进行“质”的方面的研究,这个方法需要计算的数据较少。
定量分析法:通过具体的数字,使人们对研究对象的认识进一步精确化。
跨学科研究法:运用多学科的理论、方法和成果从整体上对某一课题进行研究。
功能分析法:这是社会科学用来分析社会现象的一种方法,从某一功能出发研究多个方面的影响。
模拟法:通过创设一个与原型相似的模型来间接研究原型某种特性的一种形容方法。
三、从双语语料库中获取汉英翻译规则的研究(论文提纲范文)
(1)汉藏神经机器翻译关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第1章 绪论 |
1.1 研究背景及意义 |
1.2 机器翻译研究现状 |
1.2.1 国外研究现状 |
1.2.2 国内研究现状 |
1.3 机器翻译方法 |
1.3.1 统计机器翻译方法 |
1.3.2 神经机器翻译方法 |
1.4 主要研究内容 |
1.5 本文的创新点及贡献 |
1.6 本文组织结构 |
第2章 汉藏双语语料库构建 |
2.1 引言 |
2.2 藏文编码标准与语料库 |
2.2.1 藏文编码标准概述 |
2.2.2 语料库概述 |
2.2.3 藏文编码标准与语料库 |
2.3 汉藏双语平行语料加工规范 |
2.3.1 基本要求 |
2.3.2 数据格式 |
2.3.3 加工工具 |
2.3.4 加工流程 |
2.4 汉藏平行语料加工技术 |
2.4.1 汉藏双语语料库 |
2.4.2 汉藏双语语料获取 |
2.4.3 藏语语料预处理 |
2.5 小结 |
第3章 藏文句子边界识别 |
3.1 引言 |
3.2 藏文句子边界分析 |
3.3 藏语句子边界识别规则 |
3.4 藏语句子边界识别难点 |
3.5 藏语句子边界识别方法 |
3.5.1 Bi-LSTM+CRF架构 |
3.5.2 藏语依存句法概述 |
3.5.3 模型框架 |
3.6 实验结果与分析 |
3.7 小结 |
第4章 面向机器翻译的藏文地名识别 |
4.1 引言 |
4.2 条件随机场(CRF) |
4.3 基于CRF的藏文地名识别 |
4.3.1 CRF在藏文地名识别中的优越性 |
4.3.2 藏文地名特点及识别难点 |
4.3.3 基于CRF的藏文地名识别流程 |
4.3.4 特征选择 |
4.4 实验与结果分析 |
4.4.1 实验数据 |
4.4.2 评测指标 |
4.4.3 结果分析 |
4.4.4 系统对比 |
4.5 汉藏机器翻译中的应用 |
4.6 小结 |
第5章 基于改进字节对编码的汉藏神经机器翻译研究 |
5.1 注意力机制模型 |
5.1.1 模型概述 |
5.1.2 模型框架 |
5.2 汉藏神经机器翻译模型训练 |
5.2.1 算法概述 |
5.2.2 训练流程 |
5.3 汉藏神经机器翻译解码 |
5.3.1 贪心搜索算法 |
5.3.2 束搜索算法 |
5.4 神经机器翻译的词表处理 |
5.4.1 近似softmax函数 |
5.4.2 未登录词处理 |
5.4.3 基于词根分解的开放词汇表 |
5.5 改进的藏文字节对编码算法 |
5.5.1 字节对编码算法 |
5.5.2 改进的藏文字节对编码算法 |
5.6 实验设计与分析 |
5.6.1 实验数据 |
5.6.2 参数设置 |
5.6.3 评测方法 |
5.6.4 实验结果与分析 |
5.6.5 系统对比 |
5.7 系统架构及优化 |
5.7.1 系统化总体架构 |
5.7.2 封装改进 |
5.8 小结 |
第6章 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
攻读博士学位期间发表的论文及科研成果 |
一、发表论文 |
二、发明专利 |
三、主持和参与科研项目 |
四、科技成果 |
致谢 |
(2)基于语料库的《政府工作报告》日译文本翻译语言特征研究(论文提纲范文)
致谢 |
摘要 |
Abstract |
第一章 绪论 |
1.1 选题背景 |
1.1.1 语料库翻译学研究 |
1.1.2 中央文献翻译研究 |
1.2 研究目的和研究问题 |
1.2.1 研究目的 |
1.2.2 研究问题 |
1.3 理论框架和研究方法 |
1.3.1 理论框架 |
1.3.2 研究方法 |
1.4 研究意义和研究结构 |
1.4.1 研究意义 |
1.4.2 研究结构 |
第二章 文献综述 |
2.1 语料库翻译学 |
2.1.1 缘起与发展 |
2.1.2 研究内容 |
2.2 翻译语言特征 |
2.2.1 翻译共性 |
2.2.2 具体语言对翻译语言特征 |
2.3 语料库翻译研究现状 |
2.3.1 国内研究概况 |
2.3.2 国内各研究领域情况 |
2.3.3 日本的语料库研究 |
2.4 政府工作报告外译研究 |
2.4.1 英译、俄译研究 |
2.4.2 日译研究 |
2.5 本章小结 |
第三章 《政府工作报告》日译文本问卷调查 |
3.1 背景分析 |
3.1.1 文本类型 |
3.1.2 翻译方法 |
3.1.3 受众选择 |
3.2 第1 次问卷调查 |
3.2.1 调查概况 |
3.2.2 调查结果 |
3.2.3 结果分析 |
3.3 第2 次问卷调查 |
3.3.1 调查概况 |
3.3.2 调查结果 |
3.3.3 结果分析 |
3.4 本章小结 |
第四章 《政府工作报告》专用语料库建设 |
4.1 语料库建设现状 |
4.1.1 语料库的发展和类型 |
4.1.2 语料库翻译研究和语料库应用翻译研究 |
4.1.3 中日研究语料库 |
4.2 语料库制作 |
4.2.1 语料收集和处理 |
4.2.2 “网络爬虫” |
4.2.3 语料对齐 |
4.2.4 检索软件 |
4.3 政府工作报告专用语料库 |
4.3.1 语料收集和清理 |
4.3.2 语料库建设 |
4.3.3 语料库检索 |
4.4 本章小结 |
第五章 《政府工作报告》日译词汇特征分析 |
5.1 词汇总体特征 |
5.1.1 类符/形符比和词汇密度 |
5.1.2 词汇出现次数分布 |
5.1.3 高频词 |
5.2 词汇应用特征 |
5.2.1 略语结构 |
5.2.2 比喻结构 |
5.2.3 专有结构 |
5.3 本章小结 |
第六章 《政府工作报告》数词略语日译特征分析 |
6.1 数词略语日译探讨 |
6.1.1 观察方法 |
6.1.2 日译统计 |
6.1.3 日译分类 |
6.2 数词略语日译讨论 |
6.2.1 第1 类数词略语 |
6.2.2 第2 类数词略语 |
6.2.3 其他小类(种) |
6.3 日译词汇共性特征 |
6.4 本章小结 |
第七章 《政府工作报告》日译句法特征分析 |
7.1 句法特征 |
7.1.1 平均句长 |
7.1.2 典型语句结构应用特征 |
7.1.3 句法逻辑关系 |
7.2 外译文本句法比较 |
7.2.1 2016 年度日英译比较 |
7.2.2 2017 年度日英译比较 |
7.2.3 2018 年度日英译比较 |
7.3 日语语言要求 |
7.3.1 「连用形」语法特征 |
7.3.2 日本学者汉日翻译研究 |
7.3.3 日语文章表达要求 |
7.4 日译句法共性特征 |
7.5 本章小结 |
第八章 《政府工作报告》日译搭配和语义韵分析 |
8.1 搭配和语义韵研究 |
8.1.1 近年的相关研究 |
8.1.2 搭配和语义韵 |
8.1.3 研究方法 |
8.2 “坚持”的搭配和语义韵 |
8.2.1 “坚持”的搭配词 |
8.2.2 “坚持”的共选型式 |
8.2.3 “坚持”的语义韵 |
8.3 「坚持」的搭配和语义韵 |
8.3.1 「坚持」的搭配词 |
8.3.2 「坚持」的共选型式 |
8.3.3 「坚持」的语义韵 |
8.4 “坚持”「坚持」的语义韵比较 |
8.5 本章小结 |
第九章 结论 |
9.1 研究总结及主要发现 |
9.1.1 研究总结 |
9.1.2 主要发现 |
9.1.3 不足之处 |
9.2 中央文献日译对策思考 |
9.3 研究展望 |
参考文献 |
日本语要约 |
在学期间科研及获奖情况 |
(3)英汉双语术语自动抽取工具效率对比实验报告(论文提纲范文)
摘要 |
ABSTRACT |
第1章 实验任务介绍 |
1.1 实验背景及意义 |
1.2 实验任务介绍 |
第2章 术语及术语抽取研究综述 |
2.1 术语及特征 |
2.1.1 术语的定义 |
2.1.2 术语的基本属性 |
2.1.3 术语的结构特征 |
2.2 双语术语自动抽取方法 |
2.2.1 单语术语抽取 |
2.2.2 双语术语对齐 |
2.3 术语抽取工具效率对比研究现状 |
第3章 实验设计 |
3.1 实验语料 |
3.2 实验工具 |
3.2.1 SDL MultiTerm Extract2019 |
3.2.2 Sketch Engine OneClick Terms |
3.2.3 SynchroTerm |
3.3 实验步骤 |
3.3.1 构建术语标注语料库及双语黄金标准术语表 |
3.3.2 基于三种双语术语自动抽取 |
3.3.3 实验数据导出 |
3.4 实验结果统计 |
3.4.1 术语抽取效率评价指标 |
3.4.2 实验数据统计 |
第4章 实验结果与分析 |
4.1 双语术语自动抽取总体效率对比 |
4.1.1 汉英双语术语自动抽取总体效率对比 |
4.1.2 英汉双语术语自动抽取总体效率对比 |
4.2 不同长度双语术语自动抽取效率对比 |
4.2.1 汉英不同长度双语术语自动抽取效率 |
4.2.2 英汉不同长度双语术语自动抽取效率 |
4.3 不同频率双语术语自动抽取效率对比 |
4.3.1 不同频率的汉英双语术语抽取效率对比 |
4.3.2 不同频率的英汉双语术语抽取效率对比 |
4.4 自动抽取中双语术语遗漏情况分析 |
4.4.1 遗漏术语统计 |
4.4.2 遗漏原因分析 |
第5章 实验总结及反思 |
参考文献 |
附录1 SDL MultiTerm Extract2019 双语术语抽取情况 |
附录2 SynchroTerm双语术语抽取情况 |
附录3 Sketch Engine OneClick Terms双语术语抽取情况 |
致谢 |
(4)汉语-维语双语词汇资源库构建方法研究(论文提纲范文)
摘要 |
Abstract |
1 引言 |
1.1 研究背景 |
1.2 研究意义 |
1.3 国内国际研究现状 |
1.4 本文研究内容 |
1.5 论文结构 |
2 构建双语资源库相关理论研究 |
2.1 汉语词汇本体研究 |
2.2 维语词汇本体研究 |
2.3 汉维词对齐概述 |
2.4 汉维词对齐规范原则研究 |
2.5 语料与语料库概述 |
2.5.1 语料库 |
2.5.2 语料库构建原则及类型 |
2.6 信息检索概述 |
2.7 搜索引擎 |
3 词对齐相关技术方法 |
3.1 爬虫技术及数据处理 |
3.1.1 网络爬虫的基本原理 |
3.1.2 Scrapy工作原理及流程 |
3.2 搜索引擎技术 |
3.3 翻译插件技术 |
3.3.1 翻译插件 |
3.3.2 程序设计实现 |
3.4 基于最大相似性的句对齐技术 |
3.5 基于词典的词对齐技术 |
3.6 在搜索引擎里使用网页分级的算法 |
3.7 基于word2vec的词对齐模型 |
3.8 本章小结 |
4 汉维双语词汇资源库构建研究 |
4.1 总体架构设计 |
4.2 汉语新闻网页内容爬取的实现 |
4.2.1 采集策略 |
4.2.2 网页结构特征分析 |
4.2.3 网页内容爬取 |
4.2.4 数据处理 |
4.3 基于翻译插件的对齐语料库构建 |
4.4 传统对齐语料库构建方法对比分析 |
4.5 本章小结 |
5 基于翻译插件技术的汉维双语词汇资源库构建实现 |
5.1 引言 |
5.2 汉-维自动对齐词汇库研究思路及算法 |
5.2.1 汉-维自动对齐词汇库研究思路 |
5.2.2 汉-维自动对齐词汇库技术研究 |
5.3 爬虫技术 |
5.4 汉语语料获取与预处理技术 |
5.4.1 语料获取 |
5.4.2 语料预处理 |
5.5 汉维双语词典构造技术 |
5.5.1 标准汉维词典 |
5.5.2 汉语词汇库的研究 |
5.5.3 基于词典的汉维词对齐技术 |
5.6 基于插件翻译技术汉维双语词语对齐技术 |
5.7 多技术融合的汉维双语词语对齐器 |
5.8 界面 |
5.9 本章小结 |
6 总结与展望 |
6.1 总结 |
6.2 展望 |
参考文献 |
致谢 |
(5)贫语言资源条件下的藏汉(汉藏)机器翻译关键技术研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景和意义 |
1.1.1 研究背景 |
1.1.2 研究意义 |
1.2 藏汉机器翻译中存在的问题 |
1.3 本文主要研究内容与贡献 |
1.4 论文的结构安排 |
第二章 机器翻译概述 |
2.1 引言 |
2.2 国内外研究历史和现状 |
2.2.1 外-汉(汉-外)机器翻译 |
2.2.2 国内少数民族机器翻译 |
2.2.3 国外机器翻译 |
2.3 相关技术简述 |
2.3.1 基于规则的机器翻译 |
2.3.2 基于统计的机器翻译 |
2.3.3 神经网络机器翻译 |
2.4 本章小结 |
第三章 面向藏汉机器翻译的语言资源构建方法研究 |
3.1 引言 |
3.2 相关研究 |
3.2.1 国外语言资源构建历史与现状 |
3.2.2 国内语言资源构建历史与现状 |
3.3 藏汉双语语言资源构建方法相关理论 |
3.3.1 基于web的藏语单语语言资源构建技术 |
3.3.2 藏文分词研究 |
3.3.3 藏文命名实体识别研究 |
3.3.4 藏汉双语跨语言对齐研究 |
3.4 本章实例分析 |
3.5 本章小结 |
第四章 融合单语语言模型的藏汉机器翻译方法研究 |
4.1 引言 |
4.2 相关研究 |
4.3 相关理论方法 |
4.3.1 藏语单语语言模型构建方法 |
4.3.2 藏语单语语言模型融合策略 |
4.4 实验与分析 |
4.4.1 数据处理 |
4.4.2 实验 |
4.4.3 实验分析 |
4.5 本章小结 |
第五章 基于迭代式回译策略的藏汉机器翻译方法研究 |
5.1 引言 |
5.2 相关研究 |
5.3 相关理论方法 |
5.3.1 迭代式回译策略 |
5.3.2 平行句对过滤机制 |
5.4 实验与分析 |
5.4.1 数据准备 |
5.4.2 藏汉平行句对过滤实验 |
5.4.3 迭代式回译实验 |
5.5 本章小结 |
第六章 基于跨语言模型建模的藏汉机器翻译方法研究 |
6.1 引言 |
6.2 相关研究 |
6.3 相关理论方法 |
6.3.1 语言模型 |
6.3.2 翻译语言模型建模 |
6.4 实验与分析 |
6.4.1 语料处理及规模 |
6.4.2 藏汉双语跨语言模型的建立 |
6.4.3 实验分析 |
6.5 本章小结 |
第七章 总结与展望 |
7.1 总结 |
7.2 展望 |
参考文献 |
附录1 图目录 |
附录2 表格目录 |
攻读博士学位期间的研究成果 |
(6)目的论指导下的科技文本汉英翻译实践报告 ——以《计算机辅助翻译》为例(论文提纲范文)
摘要 |
Abstract |
Chapter 1 Description of the Translation Task |
1.1 Source of the Translation Material |
1.2 Brief Introduction of the Source Text |
1.3 Significance of the Study |
Chapter 2 Translation Process |
2.1 Preparation Before Translation |
2.1.1 Reading and Analysis of the Source Text |
2.1.2 Selection of Translation Methods |
2.2 Unification of Auxiliary Tools and Terminology |
2.3 Translation Process |
2.4 Proofreading after Translation |
Chapter 3 Overview of the Translation Principle |
3.1 An Overview of the Skopos Theory |
3.2 Principles of the Skopos Theory |
3.2.1 Skopos Rule |
3.2.2 Coherence Rule |
3.2.3 Fidelity Rule |
3.3 The Guiding Significance of Skopos Theory in C-E Translation ofComputer-aided Translationof Scientific Text |
Chapter 4 Case Analysis |
4.1 Translation at the Lexical Level |
4.1.1 Translation of Terminology |
4.1.2 Translation of Four-character Words |
4.2Translation at the Syntactic Level |
4.2.1 Translation of Long Sentence |
4.2.2 Translation of Non-subject Sentence |
4.3 Translation at the Discourse level |
Chapter 5 Conclusion |
5.1 Major Findings |
5.2 Limitations and Suggestions for Future Studies |
Bibliography |
Acknowledgements |
Appendix I Glossary |
Appendix II Source Text |
Appendix III Target Text |
Achievements |
(7)基于多模型的先秦典籍汉英平行语料句子对齐研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 研究背景 |
1.2 研究目的与意义 |
1.2.1 研究目的 |
1.2.2 研究意义 |
1.3 研究内容 |
1.4 研究方法 |
第二章 平行语料库研究现状及相关技术 |
2.1 平行语料库研究 |
2.1.1 国外相关研究 |
2.1.2 国内相关研究 |
2.2 句子对齐概念 |
2.3 双语句子对齐方法 |
2.3.1 基于长度的方法 |
2.3.2 基于词汇信息的方法 |
2.3.3 基于长度与词汇相结合的方法 |
2.4 本章小结 |
第三章 双语语料采集与语料库构建 |
3.1 网络资源选取 |
3.2 语料获取及段落级平行语料库构建 |
3.3 汉英典籍双语语料预处理 |
3.4 句子划分及人工句子对齐 |
3.5 本章小结 |
第四章 汉英双语文本分析及特征选取 |
4.1 汉英双语文本分析 |
4.2 汉英双语文本特征选取 |
4.2.1 句子长度特征 |
4.2.2 对齐模式特征 |
4.2.3 标点符号特征 |
4.2.4 关键词互译特征 |
4.3 本章小结 |
第五章 句子对齐算法选取 |
5.1 古文-英文句子对齐算法 |
5.2 分类算法概述 |
5.2.1 整体分类模型 |
5.2.2 序列标注模型 |
5.3 本章小结 |
第六章 句子对齐实现及实验结果分析 |
6.1 实验数据选取及处理 |
6.1.1 数据选取 |
6.1.2 候选句对生成 |
6.1.3 数据平衡处理 |
6.2 实验及结果分析 |
6.2.1 整体分类实验 |
6.2.2 序列标注实验 |
6.3 基于LSTM-CRF句子对齐模型的特征选择 |
6.4 基于语义特征的句子对齐 |
6.4.1 实验数据处理 |
6.4.2 实验及结果分析 |
6.5 本章小结 |
第七章 总结与展望 |
7.1 总结 |
7.2 本文创新点 |
7.3 不足与展望 |
参考文献 |
附录 关键词词典 |
致谢 |
攻读学位期间取得的学术成果目录 |
(8)以泰语为枢轴的老—汉双语语料库构建方法研究(论文提纲范文)
摘要 |
Abstract |
第一章 绪论 |
1.1 研究背景及意义 |
1.2 国内外研究现状 |
1.3 论文的研究内容 |
1.4 论文的组织 |
第二章 老挝语-泰语相似性和差异性分析 |
2.1 老挝语、泰语unicode编码分析 |
2.2 老挝语-泰语相似性分析 |
2.2.1 老挝语-泰语音节相似性 |
2.2.2 老挝语-泰语词语相似性 |
2.2.3 老挝语-泰语读音相似性 |
2.2.4 老挝语-泰语句法相似性 |
2.3 老挝语-泰语差异性分析 |
2.3.1 老挝语-泰语音节差异性 |
2.3.2 老挝语-泰语词语差异性 |
2.3.3 老挝语-泰语读音差异性 |
2.3.4 老挝语-泰语句法差异性 |
2.4 汉-泰语料库的构建 |
2.4.1 汉-泰平行语料获取 |
2.4.2 老-泰词典构建 |
第三章 以泰语为枢轴的老-汉双语句子对齐语料构建方法 |
3.1 老-汉双语语料库构建方法技术框架 |
3.2 基于语言模型的老挝语句子生成 |
3.2.1 基于词典翻译的老挝语句子生成 |
3.2.2 语言模型 |
3.2.3 模型训练 |
3.3 基于双向LSTM网络及卷积网络的老-泰双语平行句对分类模型 |
3.3.1 双向LSTM原理 |
3.3.2 句子向量表示 |
3.3.3 老-汉双语平行句对构建 |
3.4 实验及结果分析 |
3.4.1 实验数据 |
3.4.2 评价指标及实验方法 |
3.5 本章小节 |
第四章 老汉双语语料库构建原型系统设计与实现 |
4.1 系统设计 |
4.1.1 系统设计原则 |
4.1.2 系统架构 |
4.1.3 系统功能描述 |
4.2 系统开发所需工具及资源 |
4.2.1 基础开源框架 |
4.2.2 系统环境配置 |
4.3 老-泰平行句子分类模型参数设置 |
4.4 系统实现 |
4.5 本章小结 |
第五章 结语 |
致谢 |
参考文献 |
(9)基于语料库的机器翻译的现状与展望(论文提纲范文)
1. 基于语料库的机器翻译概观 |
1.1 语料库与机器翻译 |
1.2 用于机器翻译的语料库 |
1.3 基于语料库的机器翻译方法 |
2. 基于语料库的机器翻译的主要方法 |
2.1 基于实例的方法 |
2.2 基于统计的方法 |
3. 基于语料库的机器翻译的发展展望 |
(10)基于语料库的汉英程度副词比较研究(论文提纲范文)
摘要 |
ABSTRACT |
第一章 绪论 |
1.1 选题缘由 |
1.2 研究意义 |
1.3 研究现状 |
1.3.1 汉英程度副词总体研究概述 |
1.3.2 汉英程度副词比较研究概述 |
1.4 研究理论方法与框架 |
1.4.1 研究理论与方法 |
1.4.2 研究框架 |
第二章 汉英程度副词语料库建立 |
2.1 汉语程度副词的选取与鉴别 |
2.1.1 汉语程度副词的选取 |
2.1.2 汉语程度副词的鉴别 |
2.2 汉英程度副词对齐语料库的建立 |
2.2.1 语料库的处理 |
2.2.2 生语料的处理 |
2.2.3 研究材料和方法 |
2.3 汉英程度副词对比层次的语料形成 |
2.3.1 检索规则 |
2.3.2 对比语料的形成 |
2.4 检索说明 |
2.5 小结 |
第三章 低频汉英程度副词比较研究 |
3.1 低频汉语程度副词的选取 |
3.1.1 单音节汉语程度副词的选取 |
3.1.2 双音节汉语程度副词的选取 |
3.2 低频汉语程度副词与对应英语程度副词比较 |
3.2.1 以单音节汉语程度副词为基准展开的比较 |
3.2.2 以双音节程度副词为基准展开的比较 |
3.3 小结 |
第四章 汉英程度副词程度量比较 |
4.1 汉英程度副词的程度量划分等级 |
4.1.1 汉语程度副词的程度量划分等级 |
4.1.2 英语程度副词的程度量划分等级 |
4.1.3 汉英程度副词的程度量等级对应区域 |
4.2 语料库汉英程度副词修饰词类的程度量差异 |
4.2.1 修饰形容词 |
4.2.2 修饰动词 |
4.3 汉英语程度副词量级方式的比较 |
4.3.1 抽取词汇 |
4.3.2 个案分析 |
4.4 小结 |
第五章 汉英程度副词修饰动词的制约机制比较 |
5.1 受语义制约 |
5.1.1 有界、无界动词 |
5.1.2 程度有界/无界与有界/无界动词 |
5.1.3 汉英程度副词与动词搭配比较 |
5.2 受句法制约 |
5.2.1 “有界/无界”的制约 |
5.2.2 语法功能的制约 |
5.3 小结 |
第六章 汉英程度副词否定形式比较研究 |
6.1 汉英程度副词否定形式比较 |
6.1.1 词汇选取 |
6.1.2 个案比较分析 |
6.2 汉英程度副词否定指向比较 |
6.2.1 否定语义指向程度副词 |
6.2.2 否定语义指向否定副词 |
6.3 小结 |
第七章 汉英程度副词作补语比较 |
7.1 词汇选取 |
7.2 汉英补语句法单位的比较 |
7.3 汉英补语在句中位置的比较 |
7.4 汉英补语语义指向的比较 |
7.5 小结 |
第八章 汉英程度副词重叠比较研究 |
8.1 形式的比较 |
8.1.1 词汇选取 |
8.1.2 个案比较分析 |
8.2 语义的比较 |
8.3 小结 |
第九章 结语 |
9.1 本文的主要研究发现 |
9.2 本文的不足之处和有待进一步研究的问题 |
参考文献 |
附录 |
附录1: 汉语程度副词整理 |
附录2: 单音节汉语程度副词检索结果及统计 |
附录3: 双音节汉语程度副词检索结果及统计 |
附录4: 低频程度副词“稍”对应英语语料 |
四、从双语语料库中获取汉英翻译规则的研究(论文参考文献)
- [1]汉藏神经机器翻译关键技术研究[D]. 头旦才让. 西藏大学, 2021(02)
- [2]基于语料库的《政府工作报告》日译文本翻译语言特征研究[D]. 童富智. 天津外国语大学, 2020(08)
- [3]英汉双语术语自动抽取工具效率对比实验报告[D]. 张冠东. 大连外国语大学, 2020(08)
- [4]汉语-维语双语词汇资源库构建方法研究[D]. 祖力克尔江·司坎旦尔. 新疆师范大学, 2020(07)
- [5]贫语言资源条件下的藏汉(汉藏)机器翻译关键技术研究[D]. 慈祯嘉措. 青海师范大学, 2020(02)
- [6]目的论指导下的科技文本汉英翻译实践报告 ——以《计算机辅助翻译》为例[D]. 史洁. 西安理工大学, 2019(08)
- [7]基于多模型的先秦典籍汉英平行语料句子对齐研究[D]. 梁继文. 南京农业大学, 2019(08)
- [8]以泰语为枢轴的老—汉双语语料库构建方法研究[D]. 聂男(NYIANU NOULAO). 昆明理工大学, 2019(01)
- [9]基于语料库的机器翻译的现状与展望[J]. 汪云,周大军. 考试与评价(大学英语教研版), 2017(05)
- [10]基于语料库的汉英程度副词比较研究[D]. 傅伟锋. 湖南师范大学, 2017(05)