密封线自觉遵守考场纪律如考试作弊此答卷无效华北理工大学冀唐学院《机器学习双语》2023-2024 学年第一学期期末试卷院(系)_______ 班级_______ 学号_______ 姓名_______题号一二三四总分得分批阅人一、单选题(本大题共 20 个小题,每小题 2 分,共 40 分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、在进行模型融合时,以下关于模型融合的方法和作用,哪一项是不准确的?( )A. 可以通过平均多个模型的预测结果来进行融合,降低模型的方差B. 堆叠(Stacking)是一种将多个模型的预测结果作为输入,训练一个新的模型进行融合的方法C. 模型融合可以结合不同模型的优点,提高整体的预测性能D. 模型融合总是能显著提高模型的性能,无论各个模型的性能如何2、假设正在研究一个医疗图像诊断问题,需要对肿瘤进行分类。由于医疗数据的获取较为困难,数据集规模较小。在这种情况下,以下哪种技术可能有助于提高模型的性能?( )A. 使用大规模的预训练模型,并在小数据集上进行微调B. 增加模型的层数和参数数量,提高模型的复杂度C. 减少特征数量,简化模型结构D. 不进行任何特殊处理,直接使用传统机器学习算法3、想象一个文本分类的任务,需要对大量的新闻文章进行分类,如政治、经济、体育等。考虑到词汇的多样性和语义的复杂性。以下哪种词向量表示方法可能是最适合的?( )A. One-Hot 编码,简单直观,但向量维度高且稀疏B. 词袋模型(Bag of Words),忽略词序但计算简单C. 分布式词向量,如 Word2Vec 或 GloVe,能够捕捉词与词之间的语义关系,但对多义词处理有限D. 基于 Transformer 的预训练语言模型生成的词向量,具有强大的语言理解能力,但计算成本高4、想象一个图像识别的任务,需要对大量的图片进行分类,例如区分猫和狗的图片。为了达到较好的识别效果,同时考虑计算资源和训练时间的限制。以下哪种方法可能是最合适的?( )A. 使用传统的机器学习算法,如基于特征工程的支持向量机,需要手动设计特征,但计算量相对较小B. 采用浅层的神经网络,如只有一到两个隐藏层的神经网络,训练速度较快,但可能无法捕捉复杂的图像特征第 1 页,共 6 页密封线自觉遵守考场纪律如考试作弊此答卷无效C. 运用深度卷积神经网络,如 ResNet 架构,能够自动学习特征,识别效果好,但计算资源需求大,训练时间长D. 利用迁移学习,将在大规模图像数据集上预训练好的模型,如 Inception 模...