学校 ________________ 班级 ____________ 姓名 ____________ 考场 ____________ 准考证号 ………………………… 密…………封…………线…………内…………不…………要…………答…………题…………………………北京邮电大学世纪学院《数据挖掘与安全行为分析》2023-2024 学年第一学期期末试卷题号一二三四总分得分一、单选题(本大题共 20 个小题,每小题 2 分,共 40 分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、数据分析中的数据可视化不仅要美观,还要具有交互性。假设要构建一个交互式的数据可视化报表,允许用户根据自己的需求筛选和查看数据,以下哪种工具可能是最合适的?( )A. ExcelB. TableauC. PowerBID. matplotlib2、在进行数据分析时,若要检验两个总体的方差是否相等,应使用哪种检验方法?( )A. F 检验 B. t 检验 C. 卡方检验 D. 秩和检验3、在数据挖掘的关联规则挖掘中,以下哪个指标用于衡量规则的有效性和实用性?( )A. 支持度 B. 置信度 C. 提升度 D. 以上都是4、数据分析中,假设检验是常用的方法之一。以下关于假设检验的描述,错误的是:( )A. 原假设和备择假设是相互对立的B. 当 P 值小于显著性水平时,拒绝原假设C. 第一类错误是指错误地拒绝了原假设D. 样本量越大,越容易犯第二类错误5、主成分分析(PCA)是一种数据降维技术。假设要对高维数据进行降维以便于分析和可视化,以下关于主成分分析的描述,正确的是:( )A. 不考虑数据的方差和相关性,直接进行主成分提取B. 提取过多的主成分,导致信息冗余,增加分析的复杂性C. 合理确定保留的主成分数量,使其能够在最大程度保留原始数据信息的同时降低维度,并解释主成分的含义D. 认为主成分分析可以适用于所有类型的数据,不进行数据的预处理和适用性评估6、在数据清洗过程中,若发现数据存在异常值,以下哪种处理方式较为合理?( )A. 直接删除异常值 B. 对异常值进行修正 C. 将异常值视为缺失值处理 D. 分析异常值产生的原因后再决定处理方式7、在数据分析中,数据安全的重要性不言而喻。以下关于数据安全重要性的描述中,错误的是?( )第 1 页,共 6 页学校 ________________ 班级 ____________ 姓名 ____________ 考场 ____________ 准考证号 ………………………… 密…………封…………线…………内…………不…………要…………答…………题……...