下表所示的相依表匯總了超級市場的事務數(shù)據(jù)。其中hot dogs指包含熱狗的事務,指不包含熱狗的事務。hamburgers指包含漢堡的事務,指不包含漢堡的事務。
假設挖掘出的關聯(lián)規(guī)則是“hot dogs=>hamburgers”。給定最小支持度閾值25%和最小置信度閾值50%,這個關聯(lián)規(guī)則是強規(guī)則嗎?
計算關聯(lián)規(guī)則“hot dogs=>hamburgers”的提升度,能夠說明什么問題?購買熱狗和購買漢堡是獨立的嗎?如果不是,兩者間存在哪種相關關系?
您可能感興趣的試卷
你可能感興趣的試題
最新試題
根據(jù)數(shù)據(jù)科學家與數(shù)據(jù)工程師對于問題的理解并相互討論,然后確定需要收集數(shù)據(jù)的范圍以及種類,然后數(shù)據(jù)工程師使用數(shù)據(jù)收集工具,架構(gòu),甚至編程的形式來進行數(shù)據(jù)收集的工作,然后并把數(shù)據(jù)收集的數(shù)據(jù)放置到對應的存儲系統(tǒng)。
使決策樹更深將確保更好的擬合度,但會降低魯棒性。
使用偏差較小的模型總是比偏差較大的模型更好。
小數(shù)據(jù)集的數(shù)據(jù)處理最好也由計算機手段來完成。
非結(jié)構(gòu)化數(shù)據(jù)也可以使用關系型數(shù)據(jù)庫來存儲。
隨機梯度下降每次更新執(zhí)行的計算量少于批梯度下降。
要將工作申請分為兩類,并使用密度估計來檢測離職申請人,我們可以使用生成分類器。
任何對數(shù)據(jù)處理與存儲系統(tǒng)的操作均需要記錄,這符合數(shù)據(jù)安全的要求。
無論質(zhì)心的初始化如何,K-Means始終會給出相同的結(jié)果。
最大似然估計的一個缺點是,在某些情況下(例如,多項式分布),它可能會返回零的概率估計。