A.選擇任務(wù)相關(guān)的數(shù)據(jù)
B.選擇要挖掘的知識(shí)類型
C.模式的興趣度度量
D.模式的可視化表示
您可能感興趣的試卷
你可能感興趣的試題
A.關(guān)聯(lián)分析
B.分類和預(yù)測(cè)
C.孤立點(diǎn)分析
D.演變分析
E.概念描述
A.關(guān)聯(lián)分析
B.分類和預(yù)測(cè)
C.聚類分析
D.孤立點(diǎn)分析
E.演變分析
A.所涉及的算法的復(fù)雜性
B.所涉及的數(shù)據(jù)量
C.計(jì)算結(jié)果的表現(xiàn)形式
D.是否使用了人工智能技術(shù)
A.目標(biāo)市場(chǎng)分析
B.購物籃分析
C.模式識(shí)別
D.信用卡欺詐檢測(cè)
A.二分K均值
B.MST
C.Chameleon
D.組平均
最新試題
假設(shè)屬性的數(shù)量固定,則可以在時(shí)間上以線性方式學(xué)習(xí)基于高斯的貝葉斯最優(yōu)分類器,而該數(shù)量是數(shù)據(jù)集中記錄的數(shù)量。
當(dāng)MAP中使用的先驗(yàn)是參數(shù)空間上的統(tǒng)一先驗(yàn)時(shí),MAP估計(jì)等于ML估計(jì)。
由于決策樹學(xué)會(huì)了對(duì)離散值輸出而不是實(shí)值函數(shù)進(jìn)行分類,因此它們不可能過度擬合。
當(dāng)數(shù)據(jù)集標(biāo)簽錯(cuò)誤的數(shù)據(jù)點(diǎn)時(shí),隨機(jī)森林通常比AdaBoost更好。
數(shù)據(jù)收集中的拉模式需要通過定時(shí)的方式不斷地觸發(fā),才能源源不斷地獲取對(duì)應(yīng)的數(shù)據(jù)。
使用偏差較小的模型總是比偏差較大的模型更好。
無論質(zhì)心的初始化如何,K-Means始終會(huì)給出相同的結(jié)果。
支持向量機(jī)不適合大規(guī)模數(shù)據(jù)。
通常,當(dāng)試圖從大量觀察中學(xué)習(xí)具有少量狀態(tài)的HMM時(shí),我們幾乎總是可以通過允許更多隱藏狀態(tài)來增加訓(xùn)練數(shù)據(jù)的可能性。
完整性,一致性,時(shí)效性,唯一性,有效性,準(zhǔn)確性是衡量數(shù)據(jù)質(zhì)量的六個(gè)維度指標(biāo)。