学校 ________________ 班级 ____________ 姓名 ____________ 考场 ____________ 准考证号 ………………………… 密…………封…………线…………内…………不…………要…………答…………题…………………………北京语言大学《数据清洗》2023-2024 学年第一学期期末试卷题号一二三四总分得分一、单选题(本大题共 30 个小题,每小题 1 分,共 30 分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、在数据分析中,时间序列分析用于处理随时间变化的数据。假设要预测股票价格的未来走势,以下关于时间序列分析的描述,哪一项是不准确的?( )A. 移动平均法可以平滑数据,去除短期波动,突出长期趋势B. 指数平滑法能够根据历史数据的权重对未来进行预测,近期数据的权重通常较大C. 自回归整合移动平均(ARIMA)模型可以捕捉时间序列的线性和季节性特征D. 时间序列分析能够准确预测股票价格的未来值,不受市场不确定性和突发事件的影响2、对于一个分类问题,如果不同类别的样本数量差异较大,在评估模型性能时,以下哪种指标需要特别关注?( )A. 准确率B. 召回率C. F1 值D. 以上都是3、在数据分析中,探索性数据分析(EDA)用于初步了解数据的特征和规律。假设要对一个新的数据集进行 EDA ,以下关于 EDA 的描述,哪一项是不正确的?( )A. 可以通过绘制直方图、箱线图等图形来观察数据的分布情况B. 计算数据的基本统计量,如均值、中位数、众数等,有助于了解数据的集中趋势和离散程度C. EDA 只是一个初步的过程,对后续的深入分析和建模作用不大D. 发现数据中的异常值和缺失值,并思考它们可能的原因和影响4、在数据分析的聚类分析中,假设要将一组客户根据其消费行为和偏好进行分组。客户数据包括购买历史、浏览记录和评价等多维度信息。为了得到有意义且区分度高的聚类结果,以下哪种聚类算法可能表现更优?( )A. K-Means 聚类,基于距离进行分组B. 层次聚类,构建层次结构C. 密度聚类,基于数据的密度分布D. 随机将客户分配到不同的组5、在数据分析项目中,项目管理和团队协作至关重要。假设一个团队正在进行一个大型数据分析项目。以下关于项目管理的描述,哪一项是不正确的?( )A. 明确项目目标和需求,制定详细的项目计划和时间表B. 合理分配团队成员的任务,充分发挥每个人的优势C. 项目过程中不需要进行沟通和协调,各自完成自己的任务即可第 1 页,共 8 页学校...