招收攻读博士学位研究生入学考试
数据分析与挖掘考试大纲
陆军工程大学研究生招生办公室编
数据分析与挖掘考试大纲
第一部分 考试说明
一、考试性质
《数据分析与挖掘》是陆军工程大学为招收本校相关学科专业博士研究生而设置的数据工程专业水平考试,由我校自行命题,评价标准是高等学校优秀硕士毕业生进入我校攻读博士研究生应该具有的数据分析与挖掘的基础理论与应用能力。
二、考试范围
考试主要内容包括以下几个方面:
1.数据统计分析
2.数据预处理
3.关联规则挖掘
4.分类和预测
5.模型的评估与选择
6.聚类分析
三、考核重点
重点考察考生对数据分析与挖掘基本知识、基本理论及基本方法的把握,同时考查考生的数据思维、分析和解决问题能力。
第二部分 考试形式与试卷结构
一、答卷方式
闭卷考试,总计120分钟。
二、试卷结构
试卷题型分为填空题、解答题。满分100分,各知识点分值比例如下:
1.数据统计分析,10~20分
2.数据预处理,10~20分
3.关联规则挖掘,20~30分
4.分类和预测、模型的评估与选择,20~35
5.聚类分析,10~20分
第三部分 考试范围
1.数据统计分析:数据描述性统计量;相关系数和协方差;单变量、双变量和多变量的数据探索性分析。
2.数据预处理:数据清理、集成、规约和变换的手段与方法。
3.关联规则挖掘:关联规则的基本概念和性质、Apriori挖掘方法;FP-growth挖掘方法;序列模式挖掘;关联规则的评估。
4.分类和预测:分类和预测的基本概念和一般方法;利用决策树、朴素贝叶斯及贝叶斯信念网、神经网络、支持向量机等模型进行分类和预测。
5.模型的评估与选择:评估分类器性能的度量;交叉验证;利用ROC和AUC比较分类器;装袋、提升和随机森林等组合分类器;不平衡数据的处理。
6.聚类分析:聚类的基本概念和性质;k-均值、k-中心点的划分方法;凝聚与分裂的层次方法;DBSCAN基于密度的方法;聚类的评估。
第四部分 参考书目
1.Jiawei Han等著,范明等译,数据挖掘概念与技术(第三版),北京:机械工业出版社,2012.7(2017.5重印)
2.Pang-Ning Tan,数据挖掘导论,北京:人民邮电出版社,2011.