爱看书

第301章 密码(第1页)

天才一秒记住【爱看书】地址:https://www.aksss.org

基于聚类的离散化假设我们有一个包含1000个房屋的价格数据的数据集,我们想将价格分成5个簇,以下是离散化方法:首先,随机分配5个中心点。

根据每个房屋的价格和这5个中心点的距离,将每个房屋分入距离最近的中心点对应的簇中。

重新计算每个簇的中心点,以中心点的坐标作为新的中心点。

重复步骤2和步骤3,直到中心点的移动小于某个阈值或达到最大迭代次数。

最终得到的5个簇即为我们需要的离散化结果。

自适应离散化假设我们有一个包含个商品销售量数据的数据集,我们想将销售量离散化成n个区间,以下是离散化方法:先将所有商品销售量根据大小排序。

初始时,将数据集分成n个区间,每个区间保持相等的数据数量。

计算每个区间的范围(最小值和最大值),并计算相邻区间的范围的中点,这些中点作为新的分割点。

根据新的分割点重新划分区间,如果新的区间与原来的区间相同,则算法停止。

否则,重复步骤3和步骤4。

最终得到的n个区间即为我们需要的离散化结果。

卷积核输出形状卷积神经网络中的卷积层的输出维度计算,可以通过以下公式得出:输出的高度=(输入的高度-卷积核的高度+2paddg)步长+1输出的宽度=(输入的宽度-卷积核的宽度+2paddg)步长+1输出的深度=卷积核的数量这里,paddg是指在输入数据周围填充的0的行数或列数(在计算输出大小时有助于保持空间尺寸不变),步长是指卷积核移动的步数。

输出的深度直接取决于我们使用的卷积核的数量。

输入数据大小为32x32大小单通道图片,在c1卷积层使用6个大小为5x5的卷识核进行卷积,paddg=0,步长为1通过6个大小为5x5的卷识核之后的输出是多大尺寸的,怎么用公式计算给定:输入的高度h=32;输入的宽度w=32;卷积核的高度kh=5;卷积核的宽度kw=5;卷积核的数量k=6;步长s=1;paddgp=0根据上述公式,我们可以计算出卷积后的输出尺寸:输出的高度=(h-kh+2p)s+1=(32-5+20)1+1=28输出的宽度=(w-kw+2p)s+1=(32-5+20)1+1=28输出的深度=k=6所以,通过6个大小为5x5的卷积核后的输出尺寸为28x28x6。

留出法(holdoutthod):基本思想:将原始数据集划分为训练集和测试集两部分,其中训练集用于模型训练,而测试集则用于评估模型的性能。

实施步骤:根据比例或固定的样本数量,随机选择一部分数据作为训练集,剩余部分用作测试集。

优点:简单快速;适用于大规模数据集。

缺点:可能由于训练集和测试集的不同导致结果的方差较高;对于小样本数据集,留出的测试集可能不够代表性。

2交叉验证法(cross-validation):基本思想:将原始数据集划分为k个大小相等的子集(折),其中k-1个子集用于训练模型,剩下的1个子集用于测试模型,这个过程轮流进行k次,最后将k次实验的结果综合得到最终的评估结果。

实施步骤:将数据集随机划分为k个子集,依次选择每个子集作为验证集,其余子集作为训练集,训练模型并评估性能。

重复这个过程k次,取k次实验的平均值作为模型的性能指标。

优点:更充分利用了数据;可以减小因样本划分不同而引起的方差。

缺点:增加了计算开销;在某些情况下,对于特定划分方式可能导致估计偏差。

3自助采样法(bootstrappg):基本思想:使用自助法从原始数据集中有放回地进行有偏复制采样,得到一个与原始数据集大小相等的采样集,再利用采样集进行模型训练和测试。

实施步骤:从原始数据集中有放回地抽取样本,形成一个新的采样集,然后使用采样集进行模型训练和测试。

本章未完,请点击下一章继续阅读!若浏览器显示没有新章节了,请尝试点击右上角↗️或右下角↘️的菜单,退出阅读模式即可,谢谢!

如遇章节错误,请点击报错(无需登陆)

新书推荐

在奥特世界当法王天骄战纪娇娇怀孕后,傅家太子爷每天按时回家仙父电影世界的雇佣兵洪荒混沌天尊光明纪元Hello,小甜心(后来偏偏喜欢你萌妻水嫩嫩,boss套路深御灵真仙吞噬星空开分身罪青春传奇驭灵师:出金真的很难吗?大魏霸主神秀之主无敌战斗力系统绝世神医暗夜掌门人不高兴我们的家族没落了诡异星巫丹师剑宗快穿之疯批大佬又被我撩乖了命运守望者陈医生,别怂!