学校 ________________ 班级 ____________ 姓名 ____________ 考场 ____________ 准考证号 ………………………… 密…………封…………线…………内…………不…………要…………答…………题…………………………天津音乐学院《统计学》2023-2024 学年第一学期期末试卷题号一二三四总分得分一、单选题(本大题共 15 个小题,每小题 2 分,共 30 分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、在数据预处理阶段,对于含有大量缺失值的数据,以下哪种处理方法不一定合适?( )A. 直接删除含有缺失值的记录B. 用均值、中位数或众数来填充缺失值C. 通过建立模型来预测缺失值D. 对缺失值不做任何处理2、在数据分析中,若要分析数据的偏态和峰态,以下哪个统计量可以提供相关信息?( )A. 偏度系数 B. 峰度系数 C. 协方差 D. 相关系数3、在数据分析的实时数据分析场景中,假设要对不断产生的数据流进行快速处理和分析,以下哪种技术或架构可能是合适的选择?( )A. 流处理框架,如 Apache Flink B. 批处理框架,如 Apache Hadoop C. 关系型数据库,进行实时查询D. 不进行实时处理,先存储数据再事后分析4、在选择数据分析工具时,需要考虑多种因素。假设要为一个小型团队选择合适的数据分析工具,以下关于工具选择的描述,正确的是:( )A. 只追求功能强大的高端工具,不考虑成本和团队的使用难度B. 随意选择一个流行的工具,不考虑其与团队需求的匹配度C. 评估团队的技术水平、数据规模、分析需求和预算等因素,选择易于使用、功能满足需求且性价比高的数据分析工具,如 Excel、Python、R 等D. 认为一旦选择了一个工具,就不能更换,不考虑工具的更新和发展5、在进行数据分析时,需要选择合适的评估指标来衡量模型的性能。假设要评估一个分类模型的效果,以下关于评估指标的描述,哪一项是不准确的?( )A. 准确率是正确分类的样本数占总样本数的比例,但在类别不平衡的情况下可能不准确B. 召回率衡量了正类样本被正确预测的比例,适用于关注正类样本的情况C. F1 值综合了准确率和召回率,是一个较为平衡的评估指标,但计算较为复杂D. 评估指标的选择只取决于数据的特点,与模型的类型和应用场景无关6、假设我们要预测未来一段时间内的股票价格,以下哪种数据分析方法可能不太适用?()第 1 页,共 5 页学校 ________________ 班级 ____________ 姓名 ________...