四虎国产精品永久地址998_chinesexxx少妇露脸_日本丁香久久综合国产精品_一区二区久久久久_四虎av影视_久久久久国产一区二区三区不卡

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 人工智能 > 根據訓練數據是否擁有標記信息,學習任務可大致劃分為兩大類

根據訓練數據是否擁有標記信息,學習任務可大致劃分為兩大類

2018-08-15 09:46:46 | 來源:中培企業IT培訓網

根據訓練數據是否擁有標記信息,學習任務可大致劃分為兩大類:“監督學習”(supervised learning)和“無監督學習”(unsupervised learning),分類和回歸是前者的代表,而聚類則是后者的代表.需注意的是,機器學習的目標是使學得的模型能很好地適用于“新樣本”,而不是僅僅在訓練樣本上工作得很好;即便對聚類這樣的無監督學習任務,我們也希望學得的簇劃分能適用于沒在訓練集中出現的樣本.學得模型適用于新樣本的能力,稱為“泛化”(generalization)能力.具有強泛化能力的模型能很好地適用于整個樣本空間.

于是,盡管訓練集通常只是樣本空間的一個很小的采樣,我們仍希望它能很好地反映出樣本空間的特性,否則就很難期望在訓練集上學得的模型能在整個樣本空間上都工作得很好,通常假設樣本空間中全體樣本服從一個未知“分布”(distribution)D,我們獲得的每個樣本都是獨立地從這個分布上采樣獲得的,即“獨立同分布”(independent and identicallydistributed,簡稱紙d.).一般而言,訓練樣本越多,我們得到的關于D的信息越多,這樣就越有可能通過學習獲得具有強泛化能力的模型.??

標簽: 機器學習
主站蜘蛛池模板: 寿阳县| 蕉岭县| 丰都县| 蒙山县| 吉林省| 特克斯县| 兴安县| 荆门市| 新干县| 库车县| 台北市| 昔阳县| 岫岩| 泸州市| 灵丘县| 怀集县| 宁陕县| 成安县| 武穴市| 剑河县| 咸阳市| 南宁市| 北海市| 札达县| 锦屏县| 孟津县| 扶沟县| 龙江县| 柳江县| 富民县| 三亚市| 涞源县| 曲阜市| 张家港市| 新乐市| 准格尔旗| 绥江县| 来宾市| 平安县| 武冈市| 翼城县|