手机浏览器扫描二维码访问
1、将特征重要程度排序的过程与模型构建过程同时进行的特征选择方法称作嵌入式特征选择方法(√)2、线性回归模型的目标函数为残差平方和最大化(残差平方和最小化)3、特征向量中心度度量节点在网络中的影响力。网络中每个节点被赋予一个影响力分数,一个节点与更多的高分节点相连,其分数也趋向于更高。(√)4、强化学习使用已标记的数据,根据延迟奖励学习策略。(未标记的数据,通过与环境的交互来收集数据进行学习)5、过拟合是机器学习中一个重要概念,是指模型过于复杂,导致对测试数据预测很好,但对训练数据预测很差。(对训练数据预测很好,对测试数据预测很差)三、分析题(本题满分30分,共含5道小题,每小题6分)1、现有样本如下:0,2,3,4,5,6,7,8,9,10,41,42,43,44,45,46,47,48,49,50。使用等距离散化来处理该样本,将样本分为5个区间段。有几个区间内样本容量不为0?你的答案:2你的计算过程:首先,计算样本的最小值和最大值:最小值:0最大值:50然后,确定分为5个区间时的间距:(最大值-最小值)区间数=(50-0)5=10接下来,以间距为10进行等距离散化:区间1:0-9(共10个样本)区间2:10-19(无样本)区间3:20-29(无样本)区间4:30-39(无样本)区间5:40-50(共11个样本)根据以上结果,有2个区间段(区间2和区间3)内的样本容量不为0。请注意,这种等距离散化方式可能导致某些区间没有样本,而其他区间样本较多。2、随机森林采用的是什么集成方法?(A.Bagging,B.Boosting,C.Stacking)。这种集成方法适用于什么情况?你的选择:bagging你的解释:Bagging(自举汇聚法)适用于以下情况:训练数据较少,需要尽可能充分利用现有的有限样本。数据集存在较强的噪声或离群点,需要通过多个模型的平均来减小噪声影响。需要降低模型的方差,提高模型的稳定性和鲁棒性。模型复杂度较高,容易过拟合,需要引入随机性增加泛化能力。Bagging通过对原始训练集进行有放回的抽样,构建多个子模型。每个子模型相互独立地训练,并通过取平均值(回归问题)或投票(分类问题)的方式进行预测。随机森林就是一种基于Bagging思想的集成学习算法,它使用决策树作为基分类器,并通过对特征的随机选择进一步增加模型的多样性。由于Bagging的平行结构,随机森林可以有效处理大规模数据,具有较好的预测性能和计算效率。3、为了考察一种新的教学方法对学生英语成绩的影响,某学校进行了调查,共得到400个样本数据。数据表中GRADE为标签,PSI、GPA、TUC为特征。GRADE为分类数据,取1表示学习成绩提高,0表示学习成绩没有提高;PSI为分类数据,取1表示接受了新的教学方法指导,0表示没有接受新的教学方法指导;GPA表示学生平均积分点,为数值型数据;TUC表示以往的学生成绩,为数值型数据。假如,想了解GPA、TUC和PSI对学生成绩是否有影响,以及预测学生学习成绩是否会提高,你会选择下述用哪个。
模型?为什么?(A.线性回归B.逻辑回归C.聚类D.关联规则挖掘)你的选择:逻辑回归你的解释:逻辑回归是一种广泛应用于分类问题的机器学习算法。在这个情况下,我们的目标是预测学习成绩是否提高,这是一个二分类问题,即学习成绩提高或不提高。逻辑回归可以用来建立一个概率模型,根据给定的特征值(GPA、TUC和PSI),计算出学生成绩提高的概率。逻辑回归模型的输出是一个概率值,表示学生成绩提高的可能性。这使得我们能够根据学生的特征值进行预测,并判断他们学习成绩是否会提高。此外,逻辑回归还可以提供每个特征的权重系数,帮助我们理解各个特征对学生成绩的影响程度。线性回归(A.线性回归)也可用于这个问题,但它更适用于连续数值型的目标变量的预测,而不是二分类问题。聚类(C.聚类)是无监督学习方法,不适用于这个情况。关联规则挖掘(D.关联规则挖掘)通常用于发现数据中的频繁项集和关联关系,不太适合用于预测学生成绩的问题。因此,在给出的选项中,选择使用逻辑回归模型(B.逻辑回归)是合适的,它可以用于预测学生学习成绩是否会提高,并了解GPA、TUC和PSI对学生成绩的影响程度。4、K-means算法在给定数据集上运行第一次后的结果为,数据集分为三个簇:cluster1:(1,3)、(2,4);cluster2:(4,0)、(2,0);cluster3:(0,3)、(0,5)。样本(0,3)和cluster2的质心之间的曼哈顿距离为:你的答案:5你的计算过程:Cluster2的质心:(4+2)2=3;0样本的坐标是(0,3),Cluster2的质心是(3,0)。将给定的点代入公式,我们有:d=|3-0|+|0-3|=|3|+|-3|=3+3=6。
本小章还未完,请点击下一页继续阅读后面精彩内容!
。。
1Bagging(包装法):优势:Bagging通过随机有放回地对训练数据进行采样,每个基分类器独立训练,然后通过投票或平均等方式进行集成,能够有效降低过拟合风险,提高模型的泛化能力。它尤其适合在高方差的模型上使用,如决策树等。局限性:对于高偏差的模型来说,Bagging可能无法显着改善模型性能。此外,由于基分类器的独立性,Bagging不容易处理存在较强相关性的数据,比如时间序列数据。使用场景:Bagging通常用于分类和回归问题,在数据集较大且噪声相对较小的情况下表现良好。2Boosting(提升法):优势:Boosting通过迭代地训练一系列基分类器,并根据前一个分类器的性能对样本权重进行调整,使得基分类器逐渐关注于难以分类的样本。它能够有效提高模型的精度和泛化能力,尤其适合解决高偏差的问题。局限性:Boosting对噪声和异常值比较敏感,容易导致过拟合。此外,由于基分类器之间存在依赖关系,Boosting的训练过程相对较慢。使用场景:Boosting通常用于分类问题,在需要处理高偏差或低准确度的场景下表现出色。3Stacking(堆叠法):优势:Stacking通过在多个基分类器上构建一个元分类器来进行集成,可以充分利用各个基分类器的预测结果,进一步提升性能。通过允许使用更复杂的元分类器,Stacking具有更强大的表达能力。局限性:Stacking的主要挑战在于选择合适的元特征以及使用交叉验证避免数据泄露。此外,Stacking通常需要更多的计算资源和时间来进行模型训练和预测。使用场景:Stacking适用于各类机器学习问题,并且在数据集相对较大、前期已经进行了一定特征工程的情况下效果较好。
喜欢离语请大家收藏:()离语
旧世废土 满级传球,从皇马解约成全能球王 道之初境 大A爆涨,抄底娶回女明星 八零:真千金回归后,宠冠京城! 从忍界开始的游戏商人 娇妻的谎言 女神拼命保护我,却不知道我最强 全家惨死?嫡女重生后冠绝京城 萝莉控的万界之旅 全能学霸的养成系女友 你一男兵,混进女兵连当教官? 出逃五年,她带两个萌宝杀回来了 被贬后,我自立为王 航天首席重生1978 我在冷宫忙种田 快穿:逍遥路人甲 厨神:我就炒个菜,咋就飞升了? 梦境,我与轩辕 山野小仙尊
林白重生90年代,成为余谦师叔郭德刚生日当天,德云内乱眼看德云社内部乌烟瘴气,林白摇扇出现宣布成立白日阁头场演出后,网友们相当兴奋林白这是要给郭德刚架空啊!抢儿子,抢地盘,抢搭档,乐死我了,头一次见敢这么跟郭德刚对着干的人。只能说小伙子很有勇气!你们懂个屁,论辈分林白比郭德刚大,郭德刚还得管他叫大爷!...
爆,其实是一件很简单的事情,比喝水难一点。爆,其实是一件很简单的事情,大家都明白的。爆,其实是一件很简单的事情,就是爆菊花嘛!...
关于都市传奇之风云再起讲述了小镇少年叶尘的传奇人生。叶尘出生于宁静的小镇,自幼对中医满怀热忱,跟随老中医学习医术,还痴迷武侠暗自习武。然而,叶家因遭人陷害而没落。一次意外,叶尘获得神秘古籍,从中发现家族没落背后与一个神秘组织相关,复仇的种子就此种下。为了家族复兴和探寻真相,叶尘毅然前往大都市。初来乍到,他历经挫折,却凭借精湛的中医医术在一家大型医疗机构崭露头角,还结识了一群挚友。期间,他偶然救下富家千金林晓萱,两人情愫渐生。叶尘在都市中不断打脸权贵,还参与盗墓探险,获取了与神秘组织有关的重要线索。在追寻真相的过程中,他遭遇家族联姻的困境,同时也逐渐揭开当年家族被陷害的巨大阴谋。面对神秘组织的疯狂报复,叶尘在朋友和林晓萱的帮助下绝地反击。成功复仇后,叶尘让家族重振声威,与林晓萱修成正果。他开办中医学院传承医术,成为江湖传奇。但平静不久,新的恶势力崛起,叶尘再次挺身而出,最终成功守护都市和平。这部小说融合了盗墓中医武侠复仇打脸等元素,展现了叶尘从小城镇到大都市的跌宕起伏的人生历程,以及他在爱情家族正义之间的抉择与坚守,是一部充满热血与温情的精彩之作...
末日降临,丧尸遍地。郑循意外发现只有自己能免疫丧尸攻击。于是决定好好享受这份无期限末日假期,去完成属于自己的愿望清单。1买一个生日蛋糕。(顺便让恶女同学做棍选√)2秉持科学精神钻研丧尸奥秘。(需要身躯完好的丧尸可供探索,如果加上漂亮这一点就再好不过了√)3谈一场你情我愿的甜甜恋爱。(如果表白不接受,就算变成漂亮女丧尸什么的也绝对不能放过√)4亲自动手尝试做美味佳肴。(中餐的话肯定不能少了白面馒头,西餐绝对不能少了松软面包。√)5拥有八块腹肌人鱼线。(尽情开始自律,挥洒汗水吧。√)6戴着头盔骑着心爱的小摩托逛大街。(随机找小姐姐,开展社恐训练。√)本书又名末日枭雄丧版给她爱半岛贴合消逝的圣光僵男style...
前世的沈晞一心渴望得到亲情,却被假千金鸠占鹊巢,害她断了双腿,坏了双手,容貌尽毁,身患绝症,饮恨而终。重生回来的沈晞,一纸合约买断亲情,与苏家断绝关系,所有人都等着看她笑话。不久之后。假千金云七编剧的新剧,我一定要当女主!豪门母亲把这个叫采尼的设计师给我挖过来,做我的席造型师!豪门大哥找到这个L,不管用什么办法,都要让她为我所用!豪门二哥三顾茅庐,一定要夕夕老师答应为我写歌!豪门三哥这个综艺我非去不可,找他们的制作人!沈晞笑实不相瞒,以上都是我,求而不得的感觉很棒吧!所有人都以为沈晞是个被豪门抛弃的小可怜,直到有一天,华夏第一豪门傅家历经千辛万苦,终于认回了他们走失的亲妹妹。国际巨星a云七这是我妹。医届巨擎a采尼妹妹,亲的!全球顶级制作人a夕夕这是家妹,多多指教。沈晞泪流满面,活了两辈子,才找到真正的家人,你们这么牛逼,上辈子干嘛去了?世界富a沈晞正式介绍一下,这是吃瓜群众震惊体这是你妹!世界富滚,这是我老婆!...
关于综漫一身懒癌的魔王大人我是叶萧,正如你所想的一样,我穿越了,一睁眼就在一个一片碧蓝的地方,然后就有一个自称的女神说什么送自己到综漫世界,让自己成为魔王什么的。我本来还想拒绝的,魔王什么的,听起来就很麻烦,好在基础的穿越者福利能让自己能够快乐地宅下去。然后我就真香了。不对,这不是个日常世界吗?谁能告诉我那些个从书里跑出来还有那种身上冒着数据流的怪物是什么啊!!!为了让自己能够持续自己的阿宅生活,叶萧决定用那所谓的魔王的力量去解决一下,毕竟麻烦是一回事,但是有的麻烦事是必须要去做的抱歉啊各位,你们打扰了王的休息,请安静一下吧...