A.獲取數(shù)據(jù),并將原始數(shù)據(jù)轉(zhuǎn)化成自己處理的數(shù)據(jù)對象
B.緩存數(shù)據(jù),根據(jù)不同的可靠性策略,將數(shù)據(jù)保存在內(nèi)存或文件上
C.輸出數(shù)據(jù)到目的地,支持多種輸出協(xié)議
D.拆分數(shù)據(jù),根據(jù)數(shù)據(jù)的特性,將數(shù)據(jù)發(fā)送到不同的目的地
您可能感興趣的試卷
你可能感興趣的試題
A.分區(qū)字段要在創(chuàng)建表時定義
B.分區(qū)字段只能有一個,不可以創(chuàng)建多級分區(qū)
C.使用分區(qū),可以減少某些查詢的數(shù)據(jù)掃᧿范圍,進而ᨀ高查詢效率
D.分區(qū)字段可以作為where字句的條件
A.優(yōu)先從最近的DataNode下載數(shù)據(jù)
B.文件數(shù)據(jù)先從DataNode返回至NameNode,然后從NameNode下致到客戶端
C.如果客戶端和所連接的DataNode在讀取時出現(xiàn)故障,那么客戶端會放棄這其他副本所在的節(jié)點
D.支持多個客戶端同時從DataNode上讀取同一個文件數(shù)據(jù)
最新試題
Oozie的workflow.xml文件是工作流配置文件。()
在Spark應(yīng)用開發(fā)中,以下哪項的代碼能正確進行單詞統(tǒng)計?()
Fusionlnsight HD關(guān)于Oozie的作業(yè)操作命令,下列哪幾項敘述是正確的?()
在Kafka中,如下關(guān)于Producer發(fā)送數(shù)據(jù)的說法錯誤的是?()
Fusionlnsigt HD的Hive組件可以運行在哪些分布式計算機框架上?()
在Solr的應(yīng)用查詢場景中,當(dāng)對查詢結(jié)果深度翻頁時,需使用游標進行深度翻頁。下面對游標說法正確的是?()
Flume寫入HDFS時,文件的生成當(dāng)時有哪些?()
Fusionlnsight HD大數(shù)據(jù)平臺提供了哪些分布式計算框架?()
用戶要開發(fā)一個應(yīng)用去訪問HBase服務(wù),先申請了一個機機賬號teste1,并給它設(shè)置訪問HBase服務(wù)的權(quán)限:然后下載該賬戶的keytab文件,并使用該賬號運行應(yīng)用。后續(xù)此應(yīng)用增加業(yè)務(wù)需求,需訪問Hive服務(wù),那么在給tested用戶補充授予了訪問Hive組件權(quán)限后,需重新下載該用戶的keytab文件。()
在集群正常的情況下,Redis客戶端發(fā)起一次get調(diào)用,客戶端跟服務(wù)端有()次消息交互。