天津滨海职业学院《数据挖掘技术与应用》2023-2024学年第一学期期末试卷

天津滨海职业学院《数据挖掘技术与应用》2023-2024学年第一学期期末试卷_第1页
1/11
天津滨海职业学院《数据挖掘技术与应用》2023-2024学年第一学期期末试卷_第2页
2/11
天津滨海职业学院《数据挖掘技术与应用》2023-2024学年第一学期期末试卷_第3页
3/11
学校 ________________ 班级 ____________ 姓名 ____________ 考场 ____________ 准考证号 ………………………… 密…………封…………线…………内…………不…………要…………答…………题…………………………天津滨海职业学院《数据挖掘技术与应用》2023-2024 学年第一学期期末试卷题号一二三四总分得分批阅人一、单选题(本大题共 15 个小题,每小题 1 分,共 15 分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1、当分析数据的分布特征时,以下哪个图形可以直观地展示数据的众数?( )A. 直方图 B. 茎叶图 C. 箱线图 D. 饼图2、在进行数据分析时,如果需要对数据进行标准化处理以消除量纲的影响,以下哪种方法在 Python 中常用?( )A. StandardScaler 类B. MinMaxScaler 类C. Normalizer 类D. 以上都是3、关于数据分析中的数据预处理,假设数据集中存在极端值,这些极端值可能会对后续的分析产生较大影响。以下哪种处理极端值的方法可能较为恰当?( )A. 直接删除包含极端值的数据点B. 对极端值进行缩尾或截尾处理C. 将极端值替换为平均值D. 不处理极端值,保留原始数据4、数据分析中,数据安全是至关重要的问题。以下关于数据安全的说法中,错误的是?( )A. 数据安全包括数据的保密性、完整性和可用性等方面B. 数据安全问题可能会导致数据泄露、篡改和丢失等严重后果C. 采取加密、备份和访问控制等措施可以提高数据的安全性D. 数据安全只需要在数据存储和传输过程中关注,在数据分析过程中无需考虑5、在数据仓库中,星型模型和雪花模型是常见的数据模型。以下关于这两种模型的比较,错误的是?( )A. 星型模型比雪花模型更易于理解 B. 雪花模型比星型模型更节省存储空间 C. 星型模型的查询效率通常高于雪花模型 D. 雪花模型比星型模型更适合复杂的业务需求6、在数据分析中,数据抽样是一种常用的方法。以下关于数据抽样的目的,错误的是?( )A. 减少数据的数量,降低数据分析的成本和时间第 1 页,共 11 页学校 ________________ 班级 ____________ 姓名 ____________ 考场 ____________ 准考证号 ………………………… 密…………封…………线…………内…………不…………要…………答…………题…………………………B. 保证样本具有代表性,能够反映总体的特征和趋势C. 避免数据的过拟合,提高数据分析的结果的准确性和可靠性D. 增加数...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

天津滨海职业学院《数据挖掘技术与应用》2023-2024学年第一学期期末试卷

您可能关注的文档

确认删除?