久久影视这里只有精品国产,激情五月婷婷在线,久久免费视频二区,最新99国产小视频

        • 回答數(shù)

          3

        • 瀏覽數(shù)

          239

        VivianYan~
        首頁(yè) > 工程師考試 > 西安大數(shù)據(jù)工程師面試時(shí)間

        3個(gè)回答 默認(rèn)排序
        • 默認(rèn)排序
        • 按時(shí)間排序

        fj陳老詩(shī)

        已采納

        大數(shù)據(jù)工程師?= 系統(tǒng)工程 + 大規(guī)模數(shù)據(jù)處理 + 數(shù)據(jù)分析 + 機(jī)器學(xué)習(xí) +?商業(yè)智能

        大數(shù)據(jù)工程師首先是一個(gè)系統(tǒng)工程師,也是一個(gè)軟件工程師。同時(shí),他還得有一些特定的技能,會(huì)做大規(guī)模數(shù)據(jù)處理,比如當(dāng)你的數(shù)據(jù)有PB量級(jí)甚至ZD量級(jí)時(shí),你需要會(huì)Leverage云平臺(tái)等,通過(guò)幾千臺(tái)機(jī)器并行處理,解決大規(guī)模數(shù)據(jù)處理的問(wèn)題。

        大數(shù)據(jù)工程師還和數(shù)據(jù)科學(xué)家有重疊,二者都要有很強(qiáng)的數(shù)據(jù)分析能力,比如會(huì)用Matlab,R,Python等。僅僅做簡(jiǎn)單的數(shù)據(jù)分析可能也不夠,大數(shù)據(jù)工程師還得做機(jī)器學(xué)習(xí)模型,最終我們希望大數(shù)據(jù)工程師做到的是商業(yè)智能。

        大數(shù)據(jù)工程師的最終的目的,是幫助公司提供更好的用戶體驗(yàn),做出最優(yōu)決策,獲取更多的利潤(rùn)。他的工作成果是幫助企業(yè)挖掘出數(shù)據(jù)里的價(jià)值,從而實(shí)現(xiàn)Data-driven decision making。在個(gè)性化、在線廣告領(lǐng)域,大數(shù)據(jù)工程有巨大的商業(yè)價(jià)值,Yahoo,F(xiàn)acebook,Google的80%以上的收入都來(lái)源于廣告。通常,大數(shù)據(jù)工程師要解決的問(wèn)題是,當(dāng)一個(gè)用戶在網(wǎng)站上出現(xiàn)時(shí),如何顯示一個(gè)與該用戶喜好最相關(guān)的廣告,使他最有可能去點(diǎn)擊,從而提高公司的廣告收入,這些都是需要通過(guò)大數(shù)據(jù)分析和機(jī)器學(xué)習(xí)建模,幫助做決策。

        如果你是New grad,面試官期望你熟練掌握一門面向?qū)ο蟮耐ㄓ谜Z(yǔ)言 (如Java)。如果你只會(huì)C++,進(jìn)公司后可能還是得去熟悉Java,因?yàn)楹芏鄷r(shí)候編程語(yǔ)言的選擇是與所用框架相關(guān)的, 比如Hadoop就是用Java編寫的,用C++寫Hadoop的應(yīng)用就不是很方便。

        另外,熟悉一門腳本語(yǔ)言?,如Python,Go. R和Matlab不認(rèn)為是一個(gè)Decent的腳本語(yǔ)言。

        對(duì)候選人更重要的要求是基本的程序設(shè)計(jì)素養(yǎng)。如果程序設(shè)計(jì)功底足夠好,熟悉一個(gè)新語(yǔ)言就是一兩周的事情,面試官可能會(huì)從他平時(shí)工作的項(xiàng)目里提煉一些問(wèn)題,看你能不能找到合適的解決方案。

        西安大數(shù)據(jù)工程師面試時(shí)間

        329 評(píng)論(11)

        princess小姐

        【導(dǎo)語(yǔ)】近年來(lái),大數(shù)據(jù)發(fā)展如火如荼,很多人都選擇學(xué)習(xí)大數(shù)據(jù)專業(yè)或者轉(zhuǎn)行大數(shù)據(jù),大數(shù)據(jù)里又包含很多就業(yè)崗位,所以在進(jìn)行崗位選擇的時(shí)候,還是需要大家合理選擇,為了幫助大家更好的進(jìn)入大數(shù)據(jù)行業(yè)執(zhí)業(yè),下面就把2021年大數(shù)據(jù)工程師面試內(nèi)容給大家進(jìn)行一下具體介紹。

        1、自我介紹

        一般上來(lái)就是自我介紹,談下工作經(jīng)歷和項(xiàng)目經(jīng)驗(yàn),面試官會(huì)根據(jù)你的項(xiàng)目經(jīng)驗(yàn)對(duì)你進(jìn)行技術(shù)面試。在自我介紹時(shí),一定要抓住核心說(shuō),不要太啰嗦,盡量放大自己的價(jià)值,讓面試官感受到你對(duì)工作的熱情,以及以后對(duì)公司貢獻(xiàn)的能力。

        2、數(shù)倉(cāng)開發(fā)知識(shí)技能

        (1)Java是必問(wèn)的,不過(guò)問(wèn)的不深,把Javase部分吃透,足以應(yīng)付Java部分的面試。

        (2)Hadoop生態(tài),Yarn、Zookeeper、HDFS這些底層原理要懂,面試經(jīng)常被問(wèn)。

        (3)Mapreduce的shuffle過(guò)程這個(gè)也是面試被常問(wèn)的。

        (4)Hbase和HIve,搞大數(shù)據(jù)這些不懂真的說(shuō)不過(guò)去。

        (5)Mysql、Oracle和Postgres數(shù)據(jù)庫(kù)操作要回,Sql要會(huì)寫。

        (6)linux操作系統(tǒng),這個(gè)簡(jiǎn)單得命令必須要懂,會(huì)寫shell腳本更好了。

        (7)Kettle或Sqoop這種數(shù)據(jù)處理工具至少要會(huì)一個(gè)。8,數(shù)據(jù)倉(cāng)庫(kù)建模、數(shù)據(jù)模型的問(wèn)題。

        3、技術(shù)方面知識(shí)技能

        (1)SparkSql和SparkStreaming,底層原理、內(nèi)核、提交任務(wù)的過(guò)程等等,盡量深入內(nèi)幕,這個(gè)經(jīng)常會(huì)跟MapReduce作比較的。當(dāng)然也要了解Storm和Flink,F(xiàn)link這個(gè)建議要學(xué)會(huì),以后用處會(huì)越來(lái)越廣。

        (2)Redis、Kafka、ElasticSearch這些都得懂原理,深入了解,會(huì)使用,會(huì)操作,會(huì)調(diào)優(yōu)。

        (3)impala和kylin這些盡量也要了解會(huì)用

        (4)Python這個(gè)要是有能力,有精力,建議也要往深處學(xué)習(xí),我目前正在自學(xué)中。

        (5)集群的問(wèn)題,包括一些簡(jiǎn)單的運(yùn)維知識(shí)。

        (6)大數(shù)據(jù)數(shù)據(jù)傾斜的問(wèn)題,包括Spark JVM內(nèi)存調(diào)優(yōu)問(wèn)題等等。

        關(guān)于2021年大數(shù)據(jù)工程師面試內(nèi)容,就給大家介紹到這里了,希望對(duì)大家能有所幫助,當(dāng)然進(jìn)入大數(shù)據(jù)行業(yè),還需要大家在平時(shí)不斷進(jìn)行技能提升,這樣才能更好的擁有一席之地。

        323 評(píng)論(15)

        妖妖小雯雯

        我 :Hadoop適合離線分析,是批處理;Spark適合實(shí)時(shí)分析,是近實(shí)時(shí)流,微批處理。

        我 :其實(shí)自己在平時(shí)使用的時(shí)候,并沒(méi)有過(guò)度割裂開這兩種,因?yàn)楫吘棺约菏墙Y(jié)果導(dǎo)向所以無(wú)論P(yáng)ython的縮進(jìn)格式還是Java的要加逗號(hào),最后可以實(shí)現(xiàn)我的需求就可以了。 補(bǔ) :如今,再來(lái)審視這個(gè)問(wèn)題,會(huì)發(fā)現(xiàn)其實(shí)在使用過(guò)程中,Python,Java確實(shí)有一些需要你拐個(gè)彎注意下的,比如【Python】list的remove函數(shù)和【Java】list的remove方法,同名異能。以及Python一些輪子如何用Java去實(shí)現(xiàn)也是要注意的。

        我 :小于等于A表?xiàng)l數(shù),也就是小于等于3條 補(bǔ) :現(xiàn)在看來(lái),當(dāng)時(shí)陷入了工作中帶來(lái)的一個(gè)誤區(qū),就是面試官可沒(méi)說(shuō)join的字段是主鍵,它可以不唯一哈,不唯一就會(huì)導(dǎo)致大于3條,因?yàn)橛兄貜?fù),而B表記錄不足的地方均為NULL,所以可能小于嗎?不信客官你看: 例1 : A表的記錄數(shù)在B表中全都有且B表id唯一

        例2 A表的記錄在C表中有缺失但C表記錄唯一 :

        例3 A表的記錄在D表中全都有但D表id不唯一 :

        所以正解應(yīng)該是大于等于A表的條數(shù)

        345 評(píng)論(8)

        相關(guān)問(wèn)答