《基于大数据挖掘技术及工程实践》试题
及答案
《海量数据挖掘技术及工程实践》题目一、单选题
( D
)
的目的缩小数据的取值范围,使其更适合于数
据挖掘算法的需要,并且能够得到和原始数据相同的分析结果。
A.
数据清洗
B.
数据集成
C.
数据变换
D.
数据归
约
某超市研究销售纪录数据后发现,买啤酒的人很大
概率也会购买尿布,这种属于数据
挖
掘的哪类问题?
(A)
A.
关联规则发现
B.
聚类
C.
分类
D.
自然语言处理
以下两种描述分别对应哪两种对分类算法的评价
标
准?
(A)
(a)
警察抓小偷,描述警察抓的人中有多少个是小偷的
标准。
(b)
描述有多少比例的小偷给警察抓了的标准。
A.
Precision,Recall
B.
Recall,Precision
A.
Precision,ROC
D.
Recall,ROC
将原始数据进行集成、变换、维度规约、数值规约
2016
全新精品资料
-
全新公文范文
-
全程指导写作
–
独家原创
1
/
18
是在以下哪个步骤的任务?
(C)
A.
频繁模式挖掘
B.
分类和预测
C.
数据预
处
理
D.
数据流挖掘
当不知道数据所带标签时,可以使用哪种技术促使
带同类标签的数据与带其他标签的数
据相分离?
(B)
A.
分类
B.
聚类
C.
关联分析
D.
隐马
尔
可夫链
建立一个模型,通过这个模型根据已知的变量值来
预测其他某个变量值属于数据挖掘的
哪一类任务?
(C)
A.
根据内容检索
B.
建模描述
C.
预测建模
寻找模式和规则
7)
下面哪种不属于数据预处理的方法?
(D)
变量代换
B.
离散化
C.
聚集
D.
估计遗漏值
8)
假设
12
个销售价格记录组已经排序如下:
5,
10,
11,
13, 15, 35, 50, 55, 72,
92,
xx
年纪人数分别为:一年级
xx
年级
160
人,三年级
130
人,四年
级
110
人
。
则年级属性的众数是:
(A)
A.
一年级
B.
二年级
C.
三年级
D.
四年级
下列哪个不是专门用于可视化时间空间数据的技
2016
全新精品资料
-
全新公文范文
-
全程指导写作
–
独家原创
2
/
18
术:
(B)
A.
等高线图
B.
饼图
C.
曲面图
D.
矢量场图
在抽样方法中,当合适的样本容量很难确定时,
可
以使用的抽样方法是:
(D)
A.
有放回的简单随机抽样
B.
无放回的简单随机
抽
样
C.
分层抽样
D
渐进抽样
数据仓库是随着时间变化的
,
下面的描述不正确
的
是
(C)
A.
数据仓库随时间的变化不断增加新的数据内容
B.
捕
捉到的新数据会覆盖原来的快照
数据仓库随事件变化不断删去旧的数据内容
数据仓库中包含大量的综合数据
,
这些综合数据会
随
基于大数据挖掘技术及工程实践试题及答案.docx