站名: 年级专业: 姓名: 学号: 凡年级专业、姓名、学号错写、漏写或字迹不清者,成绩按零分记。………………………… 密………………………………封………………………………线…………………………中央司法警官学院《数据挖掘原理与应用》2023-2024 学年第一学期期末试卷题号一二三四总分得分一、单选题(本大题共 20 个小题,每小题 1 分,共 20 分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、数据挖掘在发现隐藏模式和知识方面发挥着重要作用。假设要从大量销售数据中挖掘潜在的客户购买模式,以下关于数据挖掘技术选择的描述,正确的是:( )A. 仅使用关联规则挖掘,不考虑其他技术B. 盲目应用所有的数据挖掘算法,不考虑数据特点和业务需求C. 结合聚类分析、分类算法和关联规则挖掘等技术,根据数据特点和问题需求选择合适的方法D. 认为数据挖掘结果一定准确,无需进一步验证和解释2、在数据分析中,数据清洗是至关重要的一步。假设我们有一个包含大量客户信息的数据集,其中存在缺失值、错误数据和重复记录。以下关于数据清洗方法的描述,正确的是:( )A. 直接删除包含缺失值的记录,以快速简化数据集B. 对于错误数据,可以根据其他相关字段的值进行推测和修正C. 忽略重复记录,因为它们对数据分析结果影响不大D. 不进行任何数据清洗操作,直接使用原始数据进行分析3、在数据分析中,建立预测模型是常见的任务之一。假设我们要预测下个月的产品销售量。以下关于预测模型的描述,哪一项是不准确的?( )A. 线性回归模型假设自变量和因变量之间存在线性关系,适用于简单的预测问题B. 决策树模型易于理解和解释,但可能会出现过拟合的问题C. 随机森林是由多个决策树组成的集成模型,性能通常优于单个决策树D. 预测模型一旦建立,就不需要根据新的数据进行更新和调整4、在评估数据分析模型的性能时,以下指标中,不能用于分类问题的是:( )A. 准确率B. 均方误差C. 召回率D. F1 值5、在数据分析的抽样方法中,假设要从一个大规模的数据集中抽取一部分样本进行分析。为了保证样本具有代表性,以下哪种抽样方法可能是较好的选择?( )A. 简单随机抽样,每个个体被抽取的概率相等B. 分层抽样,按不同层次分别抽样C. 系统抽样,按照一定的间隔抽取D. 不进行抽样,直接分析整个数据集6、在数据分析的关联规则挖掘中,以下关于支持度和置信度的说法,错误的是( )A. 支持度表示项...