A.強(qiáng)化學(xué)習(xí)與監(jiān)督學(xué)習(xí)最主要的區(qū)別在于其收到的反饋是:評(píng)估性和指導(dǎo)性
B.監(jiān)督學(xué)習(xí)給出的指導(dǎo)性反饋將會(huì)通過(guò)監(jiān)督信號(hào)告知學(xué)習(xí)者應(yīng)該要做出什么樣的行為而獲取更高的收益
C.強(qiáng)化學(xué)習(xí)的評(píng)估性反饋意味著該學(xué)習(xí)系統(tǒng)只會(huì)告訴學(xué)習(xí)者當(dāng)前的做法是好還是壞的
D.強(qiáng)化學(xué)習(xí)的目的就是找到一個(gè)最佳的策略,從而使得主體發(fā)出一系列的動(dòng)作后,收到的累積回報(bào)最多
E.策略(Policy)指的是主體的行為,是一個(gè)從狀態(tài)集合到動(dòng)作集合的映像
您可能感興趣的試卷
你可能感興趣的試題
A.方差
B.變異
C.機(jī)率
D.方向
E.平均值
A.愛(ài)德華・費(fèi)根鮑姆(EdwardFeigenbaum)
B.約翰・霍普非爾德(JohnHopfield)
C.艾倫・圖靈(AlanTuring)
D.馬文・閩斯基(MarvinMinsky)
E.克理夫・肖(CliffShaw)
A.Artificial Information
B.AutomaticInte lligence
C.ArtificialInte lligence
D.Automatic Information
E.Automatic Inspection
A.統(tǒng)計(jì)詞頻率
B.刪除停止詞與低頻詞
C.中文分詞
D.潛在語(yǔ)義分析
E.計(jì)算詞頻率-逆文文件頻率
A.停止詞、低頻詞
B.主題模型、詞袋模型
C.文分詞、英文分詞
D.詞頻率、逆文文件頻率
E.詞頻率向量、逆頻率向量
最新試題
在自然語(yǔ)言處理中,哪些方法可以用于提升自動(dòng)文本摘要的生成效果()?
人工智能中的“序列到序列”模型主要用于處理什么類(lèi)型的數(shù)據(jù)()?
數(shù)量歸約中無(wú)參數(shù)的方法一般使用()。
在自然語(yǔ)言處理中,哪些技術(shù)適用于提升問(wèn)答系統(tǒng)的性能()?
集成學(xué)習(xí)在強(qiáng)化學(xué)習(xí)中的一個(gè)常見(jiàn)應(yīng)用是什么()?
反向傳播算法和梯度下降算法在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中的主要區(qū)別是什么()?
相對(duì)化學(xué)沉淀等傳統(tǒng)工藝而言,萃取工藝的主要優(yōu)點(diǎn)是()。
在神經(jīng)網(wǎng)絡(luò)中,激活函數(shù)ReLU 的特點(diǎn)是什么()?
根據(jù)新數(shù)據(jù)集的大小和數(shù)據(jù)集的相似程度,下列選項(xiàng)不屬于遷移學(xué)習(xí)方法情況的是的是()。
Xpath 語(yǔ)言有()的構(gòu)成。