A.測試集和訓練集是相互聯(lián)系的
B.測試集是用以測試模型的數(shù)據(jù)集
C.通常測試集大約占總樣本的三分之一
D.K-次交叉驗證中,測試集只有
您可能感興趣的試卷
你可能感興趣的試題
A.數(shù)據(jù)越多越好
B.盡可能多的適合的數(shù)據(jù)
C.數(shù)據(jù)越少越好
D.以上三條都不正確
A.買B商品的顧客中,有60%的顧客會同時購買A
B.同時購買AB兩商品的顧客,占所有顧客的60%
C.買A商品的顧客中,有60%的顧客會同時購買B
D.兩商品AB在交易數(shù)據(jù)庫中同時被購買的機率為60%
A.聚類
B.分類
C.時間序列
D.關聯(lián)規(guī)則
A.直接使用該變量
B.根據(jù)是否缺失,生成指示變量,僅使用指示變量作為解釋變量
C.使用多重插補的方法進行缺失值填補
D.直接刪除該變量
A.違反了建模的假設條件
B.加大了處理的難度
C.無法針對分區(qū)后各個數(shù)據(jù)集的特征分別做數(shù)據(jù)清洗
D.無法對不同數(shù)據(jù)清理的方法進行比較,以選擇最優(yōu)方法
最新試題
下列哪些是搜集數(shù)據(jù)的組織方式()。
標準正態(tài)分布的期望值μ和標準差σ分別為()
假設某化工廠用200個O型環(huán)來密封輸送腐蝕性材料的管道閥門。每個O型環(huán)的價格為5美元,而且每兩個月要更換一次。每次更換成本為5000美元。一種心產品的抗腐蝕能力是這種O型環(huán)的兩倍。在不考慮更換成本和考慮更換成本條件下這種新材料的使用價值分別為()。
關于變異系數(shù)的表述,下列說法正確的是()。
在訓練樣本集中,對于訓練樣本數(shù)目不均衡的情況,處理方法妥當?shù)氖牵ǎ?/p>
以下對SVM算法的描述中正確的是()。
下列戰(zhàn)略中屬于合資經營中的基本戰(zhàn)略的是()。
關聯(lián)分析一般分為兩個步驟,分別為()。
關于大數(shù)據(jù)的來源,以下理解正確的是()。
關于logistic回歸的說法中不正確的是()。