站名: 年级专业: 姓名: 学号: 凡年级专业、姓名、学号错写、漏写或字迹不清者,成绩按零分记。………………………… 密………………………………封………………………………线…………………………上海行健职业学院《Hadoop+spark 大数据分析技术课程设计》2023-2024 学年第一学期期末试卷题号一二三四总分得分一、单选题(本大题共 20 个小题,每小题 1 分,共 20 分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、在数据分析的伦理和法律方面,需要遵循一定的原则和规范。假设你处理的是包含个人敏感信息的数据,以下关于数据处理的做法,哪一项是最符合伦理和法律要求的?( )A. 在未获得授权的情况下,将数据用于其他商业目的B. 对数据进行匿名化处理,确保无法追溯到个人身份C. 忽视数据的隐私保护,认为分析结果更重要D. 随意分享数据给第三方机构2、在数据分析的假设检验中,假设要检验一种新的营销策略是否显著提高了产品的销售额。收集了实施前后的销售数据,以下哪种假设检验方法可能是合适的选择?( )A. t 检验,比较两组均值B. 方差分析,比较多组均值C. 卡方检验,检验分类变量的关系D. 不进行假设检验,主观判断营销策略的效果3、在进行数据分析时,需要对数据进行预处理以提高分析的准确性和效率。假设要处理一个包含大量文本数据的数据集,需要将文本转换为可分析的数值形式。以下哪种文本预处理方法在这种情况下最为常用和有效?( )A. 词袋模型B. TF-IDF 加权C. 主题模型D. 情感分析4、在数据分析中,数据隐私和安全是需要关注的重要问题。假设要处理包含个人敏感信息的数据,以下关于数据隐私和安全的描述,哪一项是不准确的?( )A. 可以采用数据加密技术对敏感数据进行加密存储和传输,保护数据的机密性B. 匿名化和脱敏处理可以在一定程度上保护个人隐私,但需要注意处理方法的合理性C. 只要数据在企业内部使用,就不需要考虑数据隐私和安全的问题D. 遵守相关的法律法规和行业规范,是保障数据隐私和安全的基本要求5、数据分析中的因果推断旨在确定变量之间的因果关系,而不仅仅是相关性。假设我们想要研究某种药物是否真正导致了病情的改善,以下哪种方法或设计可以帮助我们进行因果推断?( )A. 随机对照试验B. 观察性研究中的工具变量法C. 断点回归设计D. 以上都是6、在数据分析中,异常值检测对于发现数据中的异常情况至关重要。假设要在一组生产数据中...