招聘頻道
當前位置:首頁 > 名企招聘 > 面試題
發布日期:2106-02-07   

每天跑多少數據?100g數據跑多久hadoop十分鐘,spark幾秒鐘—不超一分鐘,項目大概有多少mr一般來講---大概三十多個,介紹幾個reduce計算的什么自己發揮說一下項目字段。

發布日期:2019-04-17   

爬取好的數據為什么不適用python一次性的處理完成,進行展示爬取的數據有兩點,一數據量大,這就導致了使用python處理數據的難度非常大,異常緩慢,二數據內容雜,很多缺項的數據混進來,對我們的分析處理產生干擾,而python是難以篩選這些數據的,所以往往我們要通過集群進行大量數據的清洗,然后通過算法分析產生的結果進行展示。

發布日期:2019-04-17   

你遇到過反爬蟲么,怎么解決的?源網站一般會有下面幾種限制 :一定時間內單個IP訪問次數,一個正常用戶訪問網站,除非是隨意的點著玩,否則不會在一段持續時間內過快訪問一個網站,持續時間也不會太長,我們可以采用大量不規則代理ip形成一個線程池,隨機從代理池中選擇代理,模擬訪問。

發布日期:2019-04-17   

copy.copy 淺拷貝 只拷貝父對象,不會拷貝對象的內部的子對象。copy.deepcopy 深拷貝 拷貝對象及其子對象。

發布日期:2019-02-26   

面試流程年后陸陸續續的面試已經展開了,基本上以電話 + 視頻 + 現場三種面試形式為主,面試時最好都錄音下來,方便自己復盤與總結,簡歷 + 自我介紹提前準備好,一定要熟悉簡歷上

發布日期:2018-08-17   

hive的外部表怎么創建?如何使用hive來操作hbase里邊的數據?創建外部表的好處是數據可以隨時從hdfs中掛載進表中使用分區的好處是可以縮短查詢范圍。

發布日期:2018-08-17   

hbase里邊有10億條記錄,請問用實時技術檢索該記錄用了多長時間?因為HBASE基于內存做檢索,在ROWKEY設計非常理想狀態下檢測速度大概在10秒鐘左右實時分析架構用到了哪些技術。

發布日期:2018-08-17   

sort by 和 group by 的區別:當時她問完我Hadoop就問我,我就有點蒙,總覺得是在說Hadoop里面有這兩個東西,但是我又想不起來哪里有,就說了不知道,他就說不應該啊~后來才反應過來是數據庫的知識。

發布日期:2018-08-17   

什么是負載均衡?建立在現有網絡結構之上,它提供了一種廉價有效透明的方法擴展網絡設備和服務器的帶寬、增加吞吐量、加強網絡數據處理能力、提高網絡的靈活性和可用性。分攤到多個操作單元上進行執行,例如Web服務器、FTP服務器、企業關鍵應用服務器和其它關鍵任務服務器等,從而共同完成工作任務。

發布日期:2018-08-17   

越來越多的機器配備了連續測量和報告運行情況的裝置。幾年前,跟蹤遙測發動機運行僅限于價值數百萬美元的航天飛機。現在,汽車生產商在車輛中配置了監視器,連續提供車輛機械系統整體運行情況。一旦數據可得,公司將千方百計從中漁利。這些機器傳感數據屬于大數據的范圍。

發布日期:2018-08-17   

MR提交時是否有失敗,失敗了怎么辦?出現錯誤主要有以下三種:1、Task任務;2、JobTracker失敗;3、TaskTracker失敗。

發布日期:2018-08-17   

手寫MR中主函數內容、用Java寫字符串的倒序輸出:字符串倒敘String str = “abcdefg”;StringBuffer sb = new StringBuffer();for(int i=str.length()-1;i>=0;i--){sb.append(str.charAt(i));}System.out.println(sb.toString());

全國咨詢熱線:18501996998,值班手機:18501996998(7*24小時)

在線咨詢:張老師QQ 320169340

企業合作服務專線:010-82340234-821, 院校合作洽談專線:010-82340234

Copyright 2001-2019 魔據教育 - 北京華育興業科技有限公司 版權所有,京ICP備17018991號-2

免費在線咨詢立即咨詢

免費索取技術資料立即索取

大數據技術交流QQ:226594285

電話咨詢010-82340234

【看图找生肖】免费