大數據(big data),指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。下面是大數據學試題及答案,請參考!
大數據學試題及答案
1、 當前大數據技術的基礎是由( C)首先提出的。 (單選題,本題2分)
A:微軟 B:百度 C:谷歌 D:阿里巴巴
2、 大數據的起源是(C )。 (單選題,本題2分)
A:金融 B:電信 C:互聯網 D:公共管理
3、 根據不同的業務需求來建立數據模型,抽取最有意義的向量,決定選取哪種方法的數據分析角色人員是( C)。 (單選題,本題2分)
A:數據管理人員 B:數據分析員 C:研究科學家 D:軟件開發工程師
4、 (D )反映數據的精細化程度,越細化的數據,價值越高。 (單選題,本題2分)
A:規模 B:活性 C:關聯度 D:顆粒度
5、 數據清洗的方法不包括( D)。 (單選題,本題2分)
A:缺失值處理 B:噪聲數據清除 C:一致性檢查 D:重復數據記錄處理
6、 智能健康手環的應用開發,體現了( D)的數據采集技術的應用。 (單選題,本題2分) A:統計報表 B:網絡爬蟲 C:API接口 D:傳感器
7、 下列關于數據重組的說法中,錯誤的是( A)。 (單選題,本題2分)
A:數據重組是數據的重新生產和重新采集 B:數據重組能夠使數據煥發新的光芒
C:數據重組實現的關鍵在于多源數據融合和數據集成 D:數據重組有利于實現新穎的數據模式創新
8、 智慧城市的構建,不包含( C)。 (單選題,本題2分)
A:數字城市 B:物聯網 C:聯網監控 D:云計算
9、 大數據的最顯著特征是( A)。 (單選題,本題2分)
A:數據規模大 B:數據類型多樣 C:數據處理速度快 D:數據價值密度高
10、 美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標明了大風與洋流可能發生的地點。這體現了大數據分析理念中的(B )。 (單選題,本題2分)
A:在數據基礎上傾向于全體數據而不是抽樣數據
B:在分析方法上更注重相關分析而不是因果分析
C:在分析效果上更追究效率而不是絕對精確
D:在數據規模上強調相對數據而不是絕對數據
11、 下列關于舍恩伯格對大數據特點的說法中,錯誤的是(D )。 (單選題,本題2分) A:數據規模大 B:數據類型多樣 C:數據處理速度快 D:數據價值密度高
12、 當前社會中,最為突出的大數據環境是(A )。 (單選題,本題2分)
A:互聯網 B:物聯網 C:綜合國力 D:自然資源
13、 在數據生命周期管理實踐中,( B)是執行方法。 (單選題,本題2分)
A:數據存儲和備份規范 B:數據管理和維護
C:數據價值發覺和利用 D:數據應用開發和管理
14、 下列關于網絡用戶行為的說法中,錯誤的是( C)。 (單選題,本題2分)
A:網絡公司能夠捕捉到用戶在其網站上的所有行為
B:用戶離散的交互痕跡能夠為企業提升服務質量提供參考
C:數字軌跡用完即自動刪除
D:用戶的隱私安全很難得以規范保護
15、 下列關于計算機存儲容量單位的說法中,錯誤的是( C)。 (單選題,本題2分) A:1KB<1MB<1GB B:基本單位是字節(Byte)
C:一個漢字需要一個字節的存儲空間 D:一個字節能夠容納一個英文字符,
16、 下列關于聚類挖掘技術的說法中,錯誤的是(B )。 (單選題,本題2分)
A:不預先設定數據歸類類目,完全根據數據本身性質將數據聚合成不同類別
B:要求同類數據的內容相似度盡可能小
C:要求不同類數據的內容相似度盡可能小
D:與分類挖掘技術相似的是,都是要對數據進行分類處理
17、 下列國家的大數據發展行動中,集中體現“重視基礎、首都先行”的國家是( D)。 (單選題,本題2分)
A:美國 B:日本 C:中國 D:韓國
18、 下列關于大數據的分析理念的說法中,錯誤的是(D )。 (單選題,本題2分)
A:在數據基礎上傾向于全體數據而不是抽樣數據
B:在分析方法上更注重相關分析而不是因果分析
C:在分析效果上更追究效率而不是絕對精確
D:在數據規模上強調相對數據而不是絕對數據
19、 萬維網之父是( C)。 (單選題,本題2分)
A:彼得德魯克 B:舍恩伯格 C:蒂姆伯納斯-李 D:斯科特布朗
20、 Mac OS系統的開發者是(C )。 (單選題,本題2分)
A:微軟公司 B:惠普公司 C:蘋果公司 D:IBM公司
21、 大數據時代,數據使用的關鍵是( D)。 (單選題,本題2分)
A:數據收集 B:數據存儲 C:數據分析 D:數據再利用
22、 下列關于數據交易市場的說法中,錯誤的是( C)。 (單選題,本題2分)
A:數據交易市場是大數據產業發展到一定程度的產物
B:商業化的數據交易活動催生了多方參與的第三方數據交易市場
C:數據交易市場通過生產數據、研發和分析數據,為數據交易提供幫助
D:數據交易市場是大數據資源化的必然產物
23、 下列論據中,能夠支撐“大數據無所不能”的觀點的是( A)。 (單選題,本題2分) A:互聯網金融打破了傳統的觀念和行為 B:大數據存在泡沫
C:大數據具有非常高的成本 D:個人隱私泄露與信息安全擔憂
24、 數據倉庫的最終目的是(D )。 (單選題,本題2分)
A:收集業務需求 B:建立數據倉庫邏輯模型
C:開發數據倉庫的應用分析 D:為用戶和業務部門提供決策支持
25、 支撐大數據業務的基礎是( B)。 (單選題,本題2分)
A:數據科學 B:數據應用 C:數據硬件 D:數據人才
26、 在網絡爬蟲的爬行策略中,應用最為基礎的是(AB )。 (多選題,本題3分)
A:深度優先遍歷策略 B:廣度優先遍歷策略
C:高度優先遍歷策略 D:反向鏈接策略 E:大站優先策略
27、 當前,大數據產業發展的特點是(ACE )。 (多選題,本題3分)
A:規模較大 B:規模較小 C:增速很快 D:增速緩慢 E:多產業交叉融合
28、 下列關于數據生命周期管理的核心認識中,正確的是(ABC )。 (多選題,本題3分) A:數據從產生到被刪除銷毀的過程中,具有多個不同的數據存在階段
B:在不同的數據存在階段,數據的價值是不同的
C:根據數據價值的不同應該對數據采取不同的管理策略
D:數據生命周期管理旨在產生效益的同時,降低生產成本
E:數據生命周期管理最終關注的是社會效益
29、 下列關于基于大數據的營銷模式和傳統營銷模式的說法中,錯誤的是( AB)。答案選C更正選題,本題3
分)
A:傳統營銷模式比基于大數據的營銷模式投入更小
B:傳統營銷模式比基于大數據的營銷模式針對性更強
C:傳統營銷模式比基于大數據的營銷模式轉化率低
D:基于大數據的營銷模式比傳統營銷模式實時性更強
E:基于大數據的營銷模式比傳統營銷模式精準性更強
(多
30、 下列關于臟數據的說法中,正確的是( ABCDE)。 (多選題,本題3分)
A:格式不規范 B:編碼不統一 C:意義不明確 D:與實際業務關系不大 E:數據不完整
31、 數據再利用的意義在于( ABC)。 (多選題,本題3分)
A:挖掘數據的潛在價值 B:實現數據重組的創新價值
C:利用數據可擴展性拓寬業務領域 D:優化存儲設備,降低設備成本
E:提高社會效益,優化社會管理
32、 按照涉及自變量的多少,可以將回歸分析分為(CD )。 (多選題,本題3分)
A:線性回歸分析 B:非線性回歸分析 C:一元回歸分析
D:多元回歸分析 E:綜合回歸分析
33、 傳統數據密集型行業積極探索和布局大數據應用的表現是( BCE)。 (多選題,本題3分) A:投資入股互聯網電商行業 B:打通多源跨域數據
C:提高分析挖掘能力 D:自行開發數據產品
E:實現科學決策與運營
34、 大數據人才整體上需要具備(ABE )等核心知識。 (多選題,本題3分)
A:數學與統計知識 B:計算機相關知識
C:馬克思主義哲學知識 D:市場運營管理知識
E:在特定業務領域的知識
35、 下列關于大數據的說法中,錯誤的是(AD )。 (多選題,本題3分)
A:大數據具有體量大、結構單一、時效性強的特征
B:處理大數據需采用新型計算架構和智能算法等新技術
C:大數據的應用注重相關分析而不是因果分析
D:大數據的應用注重因果分析而不是相關分析
E:大數據的目的在于發現新的知識與洞察并進行科學決策
36、 在噪聲數據中,波動數據比離群點數據偏離整體水平更大。( F) (判斷題,本題2分) 是 否
37、 對于大數據而言,最基本、最重要的要求就是減少錯誤、保證質量。因此,大數據收集的信息量要盡量精確。( F) (判斷題,本題2分)
是 否
38、 一般而言,分布式數據庫是指物理上分散在不同地點,但在邏輯上是統一的數據庫。因此分布式數據庫具有物理上的獨立性、邏輯上的一體性、性能上的可擴展性等特點。(T ) (判斷題,本題2分) 是 否
39、 具備很強的報告撰寫能力,可以把分析結果通過文字、圖表、可視化等多種方式清晰地展現出來,能夠清楚地論述分析結果及可能產生的影響,從而說服決策者信服并采納其建議,是數據分析能力對大數據人才的基本要求。(F ) (判斷題,本題2分)
是 否
40、 谷歌流感趨勢充分體現了數據重組和擴展對數據價值的重要意義。( F) (判斷題,本題2分) 是 否
41、 決策樹是一種基于樹形結構的預測模型,每一個樹形分叉代表一個分類條件,葉子節點代表最終的分類結果,其優點在于易于實現,決策時間短,并且適合處理非數值型數據。( T) (判斷題,本題2分)
是 否
42、 信息生命周期管理是據生命周期管理的來源,最早由英國企業提出。( F) (判斷題,本題2分) 是 否
43、 簡單隨機抽樣,是從總體N個對象中任意抽取n個對象作為樣本,最終以這些樣本作為調查對象。在抽取樣本時,總體中每個對象被抽中為調查樣本的概率可能會有差異。( F) (判斷題,本題2分)
是 否
44、 啤酒與尿布的經典案例,充分體現了實驗思維在大數據分析理念中的重要性。(F ) (判斷題,本題2分)
是 否
45、 對于企業來說,給用戶進行各種促銷或者實施運營策略的時機也比較重要,而且對不同興趣偏好的用戶最好集中處理。( F) (判斷題,本題2分)
是 否
46.下列關于舍恩伯格對大數據特點的說法中,錯誤的是(D)
A。數據規模大 B。數據類型多樣 C。數據處理速度快D。數據價值密度高
47.下列關于大數據的分析理念的說法中,錯誤的是(D)
A.在數據基礎上傾向于全體數據而不是抽樣數據B。在分析方法上更注重相關分析而不是因果分析C。在分析效果上更追求效率而不是絕對精確D。在數據規模上強調相對數據而不是絕對數據
49.下列關于普查的缺點的說法中,正確的是(A)
A.工作量較大,容易導致調查內容有限、產生重復和遺漏現象B。誤差不易被控制C。對樣本的依賴比較強D。評測結果不夠穩定
50.下列關于聚類挖掘技術的說法中,錯誤的是(B)
A.不預先設定數據歸類類目,完全根據數據本身性質將數據聚合成不同類別B。要求同類數據的內容相似度盡可能小C。要求不同類數據的內容相似度盡可能小D。與分類挖掘技術相似的是,都是要對數據進行分類處理
51.智慧城市的構建,不包含(C)
A.數字城市B。物聯網C。聯網監控D。云計算
52.大數據的起源是(C)
A.金融B。電信C。互聯網D。公共管理
53.智慧城市的智慧之源是(C)
A.數字城市B。物聯網C。大數據D。云計算
54.假設一種基因同時導致兩件事情,一是使人喜歡抽煙,二是使這個人和肺癌就是(A)關系,而吸煙和肺癌則是(A)關系
A.因果 相關B。相關 因果C。并列 相關 D。因果 并列
55.下列關于數據交易市場的說法中,錯誤的是(C)
A.數據交易市場是大數據產業發展到一定程度的產物B。商業化的數據交易活動催生了多方參與的第三方數據交市場C。數據交易市場通過生產數據、研發和分析數據,為數據交易提供幫助D。數據交易市場是大數據資源化的必然產物
56.當前大數據技術的基礎是由(C)首先提出的
A.微軟B。百度C。谷歌D。阿里巴巴
58.下列演示方式中,不屬于傳統統計圖方式的是(D)
A.柱狀圖B。餅狀圖C。曲線圖D。網絡圖
59.當前社會中,最為突出的大數據環境是(A)
A.互聯網B。物聯網C。綜合國力D。自然資源
60.可以對大數據進行深度分析的平臺工具是(C)
A.傳統的機器學習和數據分析肛具B。第二代機器學習工具C。第二代機器學習工具D。未來機器學習工具
61.智能健康手環的應用開發,體現了(D)的數據采集技術的應用
A.統計報表B。網絡爬蟲C。API接口D。傳感器
62.支撐大數據業務的基礎是(A)
A.數據科學B。數據應用C。數據硬件D。數據人才
63.面向用戶提供大數據一站式部署方案,包括數據中心和服務器等硬件、數據分析應用軟件及技術運維支持等多方面內容的大數據商業模式是(A)
A.大數據解決方案模式B。大數據信息分類模式C。大數據處理服務模式D。大數據資源提供模式
64.美國海軍軍官莫里通過對前人航海日志的分析,繪制了新的航海路線圖,標明了大網點,這體現了大數據分析理念中的(B)
A.在數據基礎上傾向于全體數據而不是抽樣數據B。在分析方法上更注重相關分析而不是因果分析C。在分析效果上更追求效率而不是絕對精確D。在數據規模上強調相對數據而不是絕對數據
65.數據倉庫的最終目的是(D)
A.收集業務需求B。建立數據倉庫邏輯模型C。開發數據的應用分析D。為用戶和業務部門提供決策支持
66.大數據的最顯著特征是(A)
A.數據規模大B。數據類型多樣CDE
67.根據不同的業務需求來建立數據模型,抽取最有意義的向量,決定選取哪種(C)
A.數據管理人員B。數據分析員C。研究科學家D。軟件開發工程師
68.下列論據中,能夠支撐“大數據無所不能”的觀點的是(A)
A.互聯網金融打破了傳統的觀念和行為B。大數據存在泡沫C。大數據具有非常高的成本D。個人隱私泄露與信息安全擔憂
69.下列各國大數據發展路徑的描述中,對應關系正確的是(ACDE)
A.日本:走尖端IT路線B。英國:視大數據為新的自然資源C。韓國:重視基礎、首都先行D。印度:以IT外包轉型為突破口若懸河E。澳大利亞:原則先行、謹慎發展
70.當前,大數據產業發展的特點是(ACE )
A:規模較大 B:規模較小 C:增速很快 D:增速緩慢 E:多產業交叉融合
71.按照服務目的不同,數據流通平臺可分為(AC )
A.政府數據開放平臺B。企業數據開放平臺C。數據交易市場D數據研發市場E。數據廢氣交易市場
72.大數據的價值體現在(ABCDE)
A.大數據給思維方式帶來了沖擊B。大數據為政策制定提供科學論據C。大數據助力智慧城市提升公共服務水平D。大數據實現了精準營銷E。大數據的發力點在于預測
72.當前大數據技術的基礎包括(ABD)
A.分布式文件系統B。分布式并行計算C。關系型數據庫D。分布式數據庫
73.可視化高維展示技術在展示數據之間的關系以及數據分析結果方面作(BD)
A.能夠直觀反映成對數據之間的空間關系B。能夠直觀反映多維數據之間的空間關系C。能夠靜態演化事物的變化及變化的規律D。能夠動態演化事物的變化及變化的規律E。提供高性能并行計算技術的強力支撐
74.下列關于計算機存儲容量單位換算關系的公式中,正確的是( BE)
A.1KB=1012Byte B。1KB=1024Byte C。1GB=1024KB D。1GB=1012KB E。1GB=1024MB
75.第三方數據處理模式表現為:服務商通過軟件即服務或平臺即服務形式主義為用戶提供自己的數據上服務商的平臺上,由平臺進行分析處理,用戶可以在線查看相應的結果(F)是否
76.在美國的大數據大棋中,“五眼”是指配合美國進行全球監控的包含美國、英國、加拿大蘭在內的五個國家(T)是否
77.當前,企業提供的大數據解決方案大多基于Ha doop 開源項目(T)是否
78.澳大利亞政府視大數據為新的自然資源,積極承擔數據提供者的角色,主動披露政府(F) 是否
79.大數據可以分析與挖掘前之前人們不知道或者滑注意到的模式,可以從海量數據中發展趨勢,雖然也有不精準的時候,但并不能因此而否定大數據挖掘的價值(T)是否
80.數據資產型企業產品線的盈利,主要通過提供收費服務來獲取(F)是否
81.在大數據的蕩疇內,應該把用戶視為互聯網中的數據分子,獨立、細致地對其行為進行(F)是否
82.下列國家的大數據發展行動中,支持原則先行、謹慎發展的國家(D )A.英國B。韓國C。印度D。澳大利亞
83.下列論據中,體現“冷眼”看大數據的觀點的是(D )
A.互聯網金融打破了傳統的觀念和行為B。大數據醫療正在走進平民百姓C。數據資產型企業前景光明D。個人隱私泄露與信息安全擔憂
84.下列國家的大數據發展行動中,視大數據為新的自然資源的國家是(D )
A.中國B。韓國C。印度D。新加坡
85.大數據環境下的隱私擔憂,主要表現為(A)
A.個人信息的被識別與暴露B。用戶畫像的生成C。惡意廣告的推送D。病毒入侵