南开大学19秋学期(1709、1803、1809、1903、1909)《数据科学导论》在线作业(满分) 作者:周老师 分类: 南开大学 发布时间: 2019-09-18 08:41 专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等! 联系我们:QQ客服:3326650399 439328128 微信客服①:cs80188 微信客服②:cs80189 扫一扫添加我为好友 扫一扫添加我为好友 作业答案 联系QQ:3326650399 微信:cs80188 1.在回归分析中,自变量为(),因变量为()。 A.离散型变量,离散型变量 B.接连型变量,离散型变量 C.离散型变量,接连型变量 D.接连型变量,接连型变量 答案:- 2.Apriori算法的加速过程依靠于以下哪个战略( ) A.抽样 B.剪枝 C.缓冲 D.并行 答案:- 3.经过结构新的方针-线损率,当超出线损率的正常规模, 则可以判别这条线路的用户可以存在窃漏电等异常行为归于数据变换中的() A.简略函数变换 B.标准化 C.特色结构 D.接连特色离散化 答案:- 4.单层感知机模型归于()模型。 A.二分类的线性分类模型 B.二分类的非线性分类模型 C.多分类的线性分类模型 D.多分类的非线性分类模型 答案:- 5.聚类是一种()。 A.有监督学习 B.无监督学习 C.强化学习 D.半监督学习 答案:- 6.以下归于相关分析的是( ) A.CPU功能预测 B.购物篮分析 C.自动判别鸢尾花品种 D.股市趋势建模 答案:- 7.在一元线性回归模型中,残差项遵守()分布。 A.泊松 B.正态 C.线性 D.非线性 答案:- 8.变量之间的关系一般可以分为断定性关系与()。 A.非断定性关系 B.线性关系 C.函数关系 D.有关关系 答案:- 9.具有误差和至少()个S型隐含层加上一个()输出层的网络可以迫临任何有理数。 A.1,线性 B.2,线性 C.1,非线性 D.2,非线性 答案:- 10.咱们需要对已生成的树()进行剪枝,将树变得简略,然后使它具有非常好的泛化才能。 A.自上而下 B.自下而上 C.自左而右 D.自右而左 答案:- 11.比方一张表,从事务上讲,一个用户大约只会有一笔记载, 那么假定某个用户呈现了跨越一条的记载,这就发生了() A.异常值 B.纷歧致的值 C.重复值 D.缺失值 答案:- 12.实体辨认的常见方法() A.同名异义 B.异名同义 C.单位纷歧致 D.特色不一样 答案:- 13.单层感知机具有()层功用神经元。 A.一 B.二 C.三 D.四 答案:- 14.多层感知机是由()层神经元构成。 A.二 B.三 C.大于等于二层 D.大于等于三层 答案:- 15.下列两个变量之间的关系中,哪个是函数关系()。 A.人的性别和他的身高 B.人的薪酬与年纪 C.正方形的面积和边长 D.温度与湿度 答案:- 16.单层感知机是由()层神经元构成。 A.一 B.二 C.三 D.四 答案:- 17.维克托?迈尔-舍恩伯格在《大数据年代:日子、工作与思想的大改造》一书中,持续偏重了一个观念:大数据年代的到来,使咱们无法人为地去发现数据中的奇妙,与此一起,咱们更大约注重数据中的有关关系,而不是因果关系。其间,数据之间的有关关系可以经过以下哪个算法直接发掘( ) A.K-means B.Bayes Network C.C4.5 D.Apriori 答案:- 18.哪一项不归于标准化的方法() A.最小-最大标准化 B.零-均值标准化 C.小数定标标准化 D.中位数标准化 答案:- 19.K-means聚类适用的数据类型是()。 A.数值型数据 B.字符型数据 C.语音数据 D.一切数据 答案:- 20.为晓得决任何凌乱的分类疑问,运用的感知机结构应至少包括()个隐含层。 A.1 B.2 C.3 D.4 答案:- 1.间隔衡量中的间隔可所以() A.欧式间隔 B.曼哈顿间隔 C.Lp间隔 D.Minkowski间隔 答案:- 2.Apriori算法的计算凌乱度受()影响。 A.撑持度阈值 B.项数 C.事务数 D.事务均匀宽度 答案:- 3.啥情况下结点不必区别() A.其时结点所包括的样本全归于同一品种 B.其时特色集为空,或是一切样本在一切特色上取值相同 C.其时结点包括的样本集为空 D.还有子集不能被根柢正确分类 答案:- 4.下面比方归于分类的是() A.检测图像中是不是有人脸呈现 B.对客户按照告贷风险巨细进行分类 C.辨认手写的数字 D.估量商场客流量 答案:- 5.相关规则的评估衡量首要有)。 A.撑持度 B.相信度 C.精确率 D.差错率 答案:- 6.多层感知机的学习过程包括()。 A.信号的正向传达 B.信号的反向传达 C.过失的正向传达 D.过失的反向传达 答案:- 7.k近邻法的根柢要素包括()。 A.间隔衡量 B.k值的选择 C.样本巨细 D.分类抉择计划规则 答案:- 8.K-means聚类中K值选择的方法是()。 A.密度分类法 B.手肘法 C.大腿法 D.随机选择 答案:- 9.层次聚类的方法是() A.聚合方法 B.分拆方法 C.组合方法 D.比照方法 答案:- 10.有关性的分类,按照有关的方向可以分为()。 A.正有关 B.负有关 C.左有关 D.右有关 答案:- 1.啤酒与尿布的故事是聚类分析的典型实例。 T.对 F.错 答案:- 2.使用K近邻法进行分类时,运用不一样的间隔衡量所断定的迩来邻点都是相同的。 T.对 F.错 答案:- 3.数据分析师的使命:用模型来答复具体疑问,晓得数据,其来历和结构 T.对 F.错 答案:- 4.均匀削减的不纯度越大,则特征重要度越高。 T.对 F.错 答案:- 5.多元线性回归模型中,标准化偏回归系数没有单位。 T.对 F.错 答案:- 6.有关性分析首要是分析单个独立变量之间线性有关程度的强弱,并用恰当的统计方针标明出来的过程。 T.对 F.错 答案:- 7.跟着特征维数的添加,特征空间呈指数倍增加,样本密度急剧减小,样本稀少。 T.对 F.错 答案:- 8.获取数据为数据分析供给了材料和根据,这儿的数据只包括直接获取的数据。 T.对 F.错 答案:- 9.使用K近邻法进行分类时,k值过小简略发生过拟合表象。 T.对 F.错 答案:- 10.Apriori算法是一种典型的相关规则发掘算法。 T.对 F.错 答案:- 11.两个对象越类似,他们的相异度就越高。 T.对 F.错 答案:- 12.选择较小的k值,恰当于用较小的邻域中的练习实例进行预测,学习的“近似过失”会减小,“估量过失”会增大,预测成果会对近邻的点实例点非常活络。 T.对 F.错 答案:- 13.K均值(K-Means)算法是密度聚类。 T.对 F.错 答案:- 14.EDA可以最大化数据分析者对数据集和数据集底层结构的洞悉力,而且为分析者供给数据会集包括的各类信息。 T.对 F.错 答案:- 15.一般来说,信息增益越大,则意味着运用特色a来进行区别所获得的“纯度前进越大”,因而咱们可用信息增益来进行抉择计划树的最优特征选择。 T.对 F.错 答案:- 16.运用SVD方法进行图像紧缩不可以以保存图像的重要特征。 T.对 F.错 答案:- 17.跟着特征维数的添加,样本间区别度前进。 T.对 F.错 答案:- 18.特征的信息增益越大,则其越不重要。 T.对 F.错 答案:- 19.当练习集较大的时分,标准BP算法一般会更快的获得非常好的解。 T.对 F.错 答案:- 20.sigmoid函数归于阶跃函数,是神经网络中常见的激活函数。 T.对 F.错 答案:- 作业答案 联系QQ:3326650399 微信:cs80188 1709(221)1803(153)1809(153)19(153)、(208)秋(12179)南开(5584)学期(8554)大学(10551) 专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!(非免费) 联系我们:QQ客服:3326650399 439328128 微信客服①:cs80188 微信客服②:cs80189 扫一扫添加我为好友 扫一扫添加我为好友
专业辅导各院校在线、离线考核、形考、终极考核、统考、社会调查报告、毕业论文写作交流等!(非免费)
联系我们:QQ客服:3326650399 439328128 微信客服①:cs80188 微信客服②:cs80189
扫一扫添加我为好友 扫一扫添加我为好友