站名: 年级专业: 姓名: 学号: 凡年级专业、姓名、学号错写、漏写或字迹不清者,成绩按零分记。………………………… 密………………………………封………………………………线…………………………中国民航大学《大数据分析与应用综合实验(一)》2023-2024 学年第一学期期末试卷题号一二三四总分得分一、单选题(本大题共 15 个小题,每小题 2 分,共 30 分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、在数据分析中,数据安全是一个重要的问题。以下关于数据安全的描述中,错误的是?()A. 数据安全包括数据的保密性、完整性和可用性等方面B. 数据安全问题可能会导致数据泄露、篡改和丢失等后果C. 提高数据安全可以通过加密、备份和访问控制等方法来实现D. 数据安全只与数据的存储和传输有关,与数据分析的过程无关2、数据分析中的关联规则挖掘可以发现不同项之间的关联关系。假设我们在分析超市的销售数据,想要找出经常一起被购买的商品组合,以下哪个关联规则度量指标可以用来评估规则的强度?( )A. 支持度B. 置信度C. 提升度D. 以上都是3、在数据清洗过程中,若发现数据存在异常值,以下哪种处理方式较为合理?( )A. 直接删除异常值 B. 对异常值进行修正 C. 将异常值视为缺失值处理 D. 分析异常值产生的原因后再决定处理方式4、数据分析中的文本挖掘用于从大量文本数据中提取有价值的信息。假设要从客户的评价文本中挖掘他们的满意度,以下关于文本挖掘的描述,哪一项是不正确的?( )A. 可以使用词袋模型将文本转换为数值向量,以便进行后续的分析B. 情感分析能够判断文本的情感倾向,如积极、消极或中性C. 主题模型可以发现文本中的潜在主题,但无法确定每个文本所属的具体主题D. 文本挖掘不需要对文本进行预处理,如分词和去除停用词5、在数据分析的深度学习模型中,以下关于卷积神经网络(CNN)的描述,不准确的是( )A. CNN 适用于处理图像和音频等具有空间结构的数据B. CNN 通过卷积层和池化层自动提取特征C. CNN 的训练需要大量的数据和较高的计算资源D. CNN 不能用于文本数据的处理6、数据分析中,数据仓库的架构设计需要考虑多方面因素。以下关于数据仓库架构设计的说法中,错误的是?( )A. 数据仓库的架构设计应包括数据源、数据存储、数据处理和数据访问等部分B. 数据仓库的架构设计应考虑数据的规模、增长速度和使用频率等因素C. 数据仓库的架构设...