爱看书

第302章 怎么都不来啊(第1页)

天才一秒记住【爱看书】地址:https://www.aksss.org

1、将特征重要程度排序的过程与模型构建过程同时进行的特征选择方法称作嵌入式特征选择方法(√)2、线性回归模型的目标函数为残差平方和最大化(残差平方和最小化)3、特征向量中心度度量节点在网络中的影响力。

网络中每个节点被赋予一个影响力分数,一个节点与更多的高分节点相连,其分数也趋向于更高。

(√)4、强化学习使用已标记的数据,根据延迟奖励学习策略。

(未标记的数据,通过与环境的交互来收集数据进行学习)5、过拟合是机器学习中一个重要概念,是指模型过于复杂,导致对测试数据预测很好,但对训练数据预测很差。

(对训练数据预测很好,对测试数据预测很差)三、分析题(本题满分30分,共含5道小题,每小题6分)1、现有样本如下:0,2,3,4,5,6,7,8,9,10,41,42,43,44,45,46,47,48,49,50。

使用等距离散化来处理该样本,将样本分为5个区间段。

有几个区间内样本容量不为0?你的答案:2你的计算过程:首先,计算样本的最小值和最大值:最小值:0最大值:50然后,确定分为5个区间时的间距:(最大值-最小值)区间数=(50-0)5=10接下来,以间距为10进行等距离散化:区间1:0-9(共10个样本)区间2:10-19(无样本)区间3:20-29(无样本)区间4:30-39(无样本)区间5:40-50(共11个样本)根据以上结果,有2个区间段(区间2和区间3)内的样本容量不为0。

请注意,这种等距离散化方式可能导致某些区间没有样本,而其他区间样本较多。

2、随机森林采用的是什么集成方法?(abaggg,bboostg,cstackg)。

这种集成方法适用于什么情况?你的选择:baggg你的解释:baggg(自举汇聚法)适用于以下情况:训练数据较少,需要尽可能充分利用现有的有限样本。

数据集存在较强的噪声或离群点,需要通过多个模型的平均来减小噪声影响。

需要降低模型的方差,提高模型的稳定性和鲁棒性。

模型复杂度较高,容易过拟合,需要引入随机性增加泛化能力。

baggg通过对原始训练集进行有放回的抽样,构建多个子模型。

每个子模型相互独立地训练,并通过取平均值(回归问题)或投票(分类问题)的方式进行预测。

随机森林就是一种基于baggg思想的集成学习算法,它使用决策树作为基分类器,并通过对特征的随机选择进一步增加模型的多样性。

由于baggg的平行结构,随机森林可以有效处理大规模数据,具有较好的预测性能和计算效率。

3、为了考察一种新的教学方法对学生英语成绩的影响,某学校进行了调查,共得到400个样本数据。

数据表中grade为标签,psi、gpa、tuc为特征。

grade为分类数据,取1表示学习成绩提高,0表示学习成绩没有提高;psi为分类数据,取1表示接受了新的教学方法指导,0表示没有接受新的教学方法指导;gpa表示学生平均积分点,为数值型数据;tuc表示以往的学生成绩,为数值型数据。

假如,想了解gpa、tuc和psi对学生成绩是否有影响,以及预测学生学习成绩是否会提高,你会选择下述用哪个。

模型?为什么?(a线性回归b逻辑回归c聚类d关联规则挖掘)你的选择:逻辑回归你的解释:逻辑回归是一种广泛应用于分类问题的机器学习算法。

在这个情况下,我们的目标是预测学习成绩是否提高,这是一个二分类问题,即学习成绩提高或不提高。

逻辑回归可以用来建立一个概率模型,根据给定的特征值(gpa、tuc和psi),计算出学生成绩提高的概率。

逻辑回归模型的输出是一个概率值,表示学生成绩提高的可能性。

这使得我们能够根据学生的特征值进行预测,并判断他们学习成绩是否会提高。

此外,逻辑回归还可以提供每个特征的权重系数,帮助我们理解各个特征对学生成绩的影响程度。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

恐怖女网红主神崛起火影:从双神威开始邪医妖妃名动天下巡狩万界帝霸天医出狱我的悟性爆炸了征服原始人全民:我的武器可以无限成长!妙手人生我是导演,我不比烂白袍总管传奇驭灵师:出金真的很难吗?丹师剑宗港综世界完美人生斗罗:我教皇身份被比比东曝光了女侠且慢仙域科技霸主大周仙吏长生界电影世界的雇佣兵惊悚乐园人在斗罗开局加入聊天群从领主到维度魔神