更多"[单选题] 将相同的或相似的数据或数据特征归类,使用较少的数据量描述原"的相关试题:
[填空题]()是在数据中发现数据对象之间的关系,将数据进行分组,组内的相似性越大,组间的差别越大,则聚类效果越好
[判断题]数据库的主要特征是数据共享和数据集中管理。
A.正确
B.错误
[单选题]假如我们使用 Lasso 回归来拟合数据集,该数据集输入特征有 100 个(X1,X2,…,X100)。现在,我们把其中一个特征值扩大 10 倍(例如是特征 X1),然后用相同的正则化参数对 Lasso 回归进行修正。
那么,下列说法正确的是?
A.A. 特征 X1 很可能被排除在模型之外
B.B. 特征 X1 很可能还包含在模型之中
C.C. 无法确定特征 X1 是否被舍弃
D.D. 以上说法都不对
[判断题]大数据具有海量的数据规模、快速的数据流转、统一的数据类型和价值密度低四大特征,是信息化发展的新阶段。
A.正确
B.错误
[判断题]外模式也称子模式或用户模式,它是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述。
A.正确
B.错误
[判断题]查看数据集的基本统计描述,能够帮助我们了解数据的全貌,但不能够识别数据的分布特征。
A.正确
B.错误
[判断题]为数据表创建索引的目的是归类
A.正确
B.错误
[判断题]网络数据库具有数据量大、易于修改、能实现动态数据更新、便于远程维护。
A.正确
B.错误
[填空题]机器学习的一般流程包括获取数据、数据处理、特征工程、算法训练和()
[判断题]在聚类算法中,使用欧氏距离作为距离度量,欧氏距离越小,两个数据相似度越低
A.正确
B.错误
[单选题]根据关系数据基于的数据模型——关系模型的特征判断下列正确的一项:( )
A.只存在一对多的实体关系,以图形方式来表示。
B.以二维表格结构来保存数据,在关系表中不允许有重复行存在。
C.能体现一对多、多对多的关系,但不能体现一对一的关系。
D.关系模型数据库是数据库发展的最初阶段。
[判断题]区间作业调用GYK基本数据时,若使用前方车站号调取数据失败,则可以使用后方车站调取数据。
A.正确
B.错误
[判断题]大数据有4个特点,即数据量大、数据类型多、处理速度快和价值高。( )
A.正确
B.错误
[判断题]统计分析和趋势分析需要一定量的检测数据,数据量越大,获取数据的时间间隔越短,分析结果越准确
A.正确
B.错误