北京市大兴区2023-2024学年5月高考适应性测试语文试题
- 资源简介:
共22题,约12290字。
北京市大兴区2023-2024学年5月高考适应性测试语文试题 2024.05
本试卷共10页,150分。考试时长150分钟。考生务必将答案答在答题卡上,在试卷上作答无效。考试结束后,将本试卷和答题卡一并交回。
一、本大题共5小题,共18分。
阅读下面材料,完成1-5题。
材料一
华夏文明作为持续了上千年的文明,具有独特的文化形式和特殊的文化传统,文言文是记录传统文化的主要形式。为了解决文言文翻译问题,研究者将智能语音交互理念引入了文言文机器翻译的关键技术研发,使得译文质量满足文言文翻译需求。
智能语音交互的实现,需要以待翻译语言的预处理为前提,采用自然语言处理技术,主要包括语法分析、句法及语义分析、语境解析三个主体部分。其中,语法分析作为最关键的处理环节,由分词、词性标注、命名实体识别三部分构成。分词是将原始语音输出序列,按照合理的划分模式,切割为可以被翻译机器人识别的词语序列,促进后续文言文翻译的顺利进行。考虑到部分文言文词语与白话文词语语义差别较大,极易引发切分歧义问题,研究者提出在分词模块融入机器学习理念,建立分词数据库,再针对分词处理后的单个词语,进行词性标注,表明该单词的基本含义和语言形式。最后,针对标注后的词语进行命名实体识别,也就是从所有的标注词语中,选取特定类别的实体名词,进行特殊标注,便于后续智能交互沟通。
句法及语义分析的主要目的是更好地理解待翻译文言文的语言成分关系,有两个组成部分。语义角色标注可以根据某些短语,提取出主语、谓语、宾语等基本信息,作为文言文翻译的支撑框架。而语义依存分析,则是为了体现句子的语义关联,便于翻译过程中对抽象词汇的理解。
除此之外,自然语言处理机制的建立,还需要设计以具体应用语境为基础的语言处理模式,简单来说,就是按照指示图谱,分析文言文中类似场景,从而对语言进行属性理解。例如,可以依托于某个语义图画,联想出该词语的扩展语义,对待翻译信息进行应用场景分类,最终选定一个可能性最高的分类结果,作为最终语言识别结果。需要注意的是,语境组合过程中,需要添加纠错机制处理理解失误的信息。
(取材自刘秋鸽、闵亮的相关文章)
材料二
从处理对象的粒度角度,古文自动处理可以分为词汇层面、句子层面和篇章层面等。古文词汇自动处理,又称古文自动词法分析,是指通过计算机算法,对数字化处理后的古代典籍文献进行自动分词、词性标注、命名实体识别等处理,从而开展词汇层面的知识挖掘。词汇自动处理是古文自动处理的基础,也是实现句子和篇章层面古文自动处理的前提条件,还是构建词汇级别语料库与知识库,实现古文信息检索、机器翻译、自动问答的前提。
1.根据材料一,下列说法正确的一项是(3分)
A.只有完成待翻译语言的预处理,才能实现智能语音交互。
B.文言文与白话文词语语义差别较大,一定会引发切分歧义问题。
C.只要在分词模块融入机器学习理念,就能使文言文翻译顺利进行。
D.只要完成待翻译信息的应用场景分类,就能避免信息理解失误。
2.根据材料二,下列说法不正确的一项是(3分)
A.想要实现古文信息检索、机器翻译,必须先完成词汇自动处理。
B.古汉语不同于现代汉语,字词之间没有分隔符,加大了机器处理难度。
C.基于规则的分词方式只能识别已收录信息,无法理解和推断新信息。
D.古文自动分词的效率既和所采用的模型有关,也和机器硬件配置有关。
3.根据材料一、二,结合上下文推断,下列对加点词解释有误的一项是(3分)
A.命名实体:指文本中具有特定意义的专有名词或词汇,如人名、地名。
B.语义图画:根据特定语义自动生成图片,完成人工智能辅助的绘画。
C.粒度:指在数据分析或系统设计中,数据或系统组件划分的详细程度。
D.领域词表:特定学科或专业领域的古文文献中常用术语和词汇的集合。
4.根据材料一、二,下列理解和推断不正确的一项是(3分)
A.自然语言处理中的语法分析是词汇层面的处理。
B.基于统计的分词方法能实现对词频的自动统计。
C.古文自动分词的三个阶段都需要人工处理参与。
D.机器学习提高了古文自动翻译工具的研发效率。
5.请根据以上两则材料,填写下面关于“文言文自动翻译原理”的结构图。(6分)
二、本大题共6小题,共28分。
阅读下面文言文,完成6-10题。(共18分)
原毁
韩愈
古之君子,其责己也重以周,其待人也轻以约。重以周,故不怠;轻以约,故人乐为善。闻古之人有舜者,其为人也,仁义人也。求其所以为舜者,责于己曰:“彼,人也;予,人也。彼能是,而我乃不能是!”早夜以思,去其不如舜者,就其如舜者。闻古之人有周公者,其为人也,多才与艺人也。求其所以为周公者,责于己曰:“彼,人也;予,人也。彼能是,而我乃不能是!”早夜以思,去其不如周公者,就其如周公者。舜,大圣人也,后世无及焉;周公,大圣人也,后世无及焉。