欧美麻豆久久久久久中文_成年免费观看_男人天堂亚洲成人_中国一级片_动漫黄网站免费永久在线观看_国产精品自产av一区二区三区

中培偉業IT資訊頻道
您現在的位置:首頁 > IT資訊 > 軟件研發 > 訓練/測試集的劃分要盡可能保持數據分布的一致性

訓練/測試集的劃分要盡可能保持數據分布的一致性

2018-08-16 09:51:03 | 來源:中培企業IT培訓網

需注意的是,訓練/測試集的劃分要盡可能保持數據分布的一致性,避免因數據劃分過程引入額外的偏差而對最終結果產生影響,例如在分類任務中至少要保持樣本的類別比例相似.如果從采樣(sampling)的角度來看待數據集的劃分過程,則保留類別比例的采樣方式通常稱為“分層采樣”(stratifiedsampling).例如通過對D進行分層采樣而獲得含70070樣本的訓練集S和含30070樣本的測試集T,若D包含500個正例、500個反例,則分層采樣得到的S應包含350個正例、350個反例,而T則包含150個正例和150個反例;若S、T中樣本類別比例差別很大,則誤差估計將由于訓練/測試數據分布的差異而產生偏差,另一個需注意的問題是,即便在給定訓練/測試集的樣本比例后,仍存在多種劃分方式對初始數據集D進行分割.

標簽: 測試集

相關閱讀

主站蜘蛛池模板: 免费A级毛片无码免费视频首页 | 成人444kkkk在线观看 | 野狼AV午夜福利在线 | 国产免费久久精品99久久 | 永久免费无码国产 | 18免费看 | 日韩精品久久久肉伦网站 | 在线免费看黄 | 五十路六十路老熟妇a片 | 四虎影视永久地址 | 亚洲国产成人av在线观看 | 国产 国语对白 露脸 | 免费女人18毛片a毛片视频 | 成午夜免费视频在线观看 | 黄色网z | 欧美黑人又大又粗XXXXX | 综合无码一区二区三区四区五区 | 九九99九九精彩网站 | 高H禁伦餐桌上的肉伦NP | 2021国产精品国产精华 | 狂猛欧美激情性XXXX大豆行情 | 激情综合婷婷色五月蜜桃 | 日本aⅴ亚洲精品中文乱码 美女胸18大禁视频网站 | 欧美在线网址 | 被触手玩弄狠狠侵犯男男 | 午夜成人鲁丝片午夜精品 | 午夜免费观看_视频在线观看 | 国产在线无遮挡免费观看 | 国内精品伊人久久久久AV | 国产日韩在线视看第一页 | 精品人妻无码一区二区三区手机版 | 在线日韩AV永久免费观看 | 无码永久免费AV网站不卡 | 亚洲日韩成人无码私人影院 | 色欲精品国产一区二区三区AV | 精品乱人伦一区二区三区 | 色先锋资源久久综合5566 | 国产内射爽爽大片视频社区在线 | 18禁止观看强奷在线看 | 久久亚洲美女精品国产精品 | 日本大尺度无删减在线观看 |