勿忘我1239
零基礎開始學習的話,大概需要5個月左右。大數(shù)據(jù)挖掘工程師的課程內(nèi)容涉獵很多,包括JavaSE 開發(fā)、JavaEE開發(fā)、并發(fā)編程實戰(zhàn)開發(fā)、Linux精講、Hadoop 生態(tài)體系、Python 實戰(zhàn)開發(fā)、Storm 實時開發(fā)、Spark 生態(tài)體系、ElasticSearc、Docker容器引擎、機器學習、超大集群調(diào)優(yōu)、大數(shù)據(jù)項目實戰(zhàn)等。如果想要全部掌握以上的知識,必須要進行系統(tǒng)的學習,建議報名相關的專業(yè)機構(gòu)進行線上或者線下課程的學習。同時,學成之后大數(shù)據(jù)工程師的就業(yè)前景還是很明朗的,在薪酬待遇也是很有優(yōu)勢的,因為大數(shù)據(jù)工程師在IT類職業(yè)中比較稀缺的,收入待遇可以說達到了同類的頂級。國內(nèi)IT、通訊、行業(yè)招聘中,有10%都是和大數(shù)據(jù)相關的,且比例還在上升。想要了解更多有關數(shù)據(jù)挖掘的信息,可以了解一下CDA數(shù)據(jù)分析師的課程。課程內(nèi)容兼顧培養(yǎng)解決數(shù)據(jù)挖掘流程問題的橫向能力以及解決數(shù)據(jù)挖掘算法問題的縱向能力。要求學生具備從數(shù)據(jù)治理根源出發(fā)的思維,通過數(shù)字化工作方法來探查業(yè)務問題,通過近因分析、宏觀根因分析等手段,再選擇業(yè)務流程優(yōu)化工具還是算法工具,而非“遇到問題調(diào)算法包”點擊預約免費試聽課。
angel小芋頭
大數(shù)據(jù)學習分以下3種情況一、自學。學習能力強有一定開發(fā)基礎的可以嘗試自學,雖然有點難,但是還是有一些學習能力強的學生可以通過自學成材的,自學一般都是根據(jù)自身碎片化時間進行學習,時間會拉的比較長。自學的優(yōu)點:是可以省下一筆學費,而且不占用自己的工作時間。自學的缺點:遇到問題難以解決,無老師輔導。無真實企業(yè)項目可以實訓二、企業(yè)內(nèi)部學習。企業(yè)內(nèi)部培養(yǎng)可造之材,由技術(shù)人員帶,學習時間視企業(yè)情況而定。優(yōu)點:上手快,有人帶,無需支付費用缺點:機會少,大多數(shù)學生沒有這樣的機會三、線下培訓學習。線下培訓學習時間5-6個月??赡苡袑W生問為什么沒有線上培訓學習呢?對于學習大數(shù)據(jù)技術(shù)目前線上培訓無法保證學生的學習質(zhì)量,如果你能夠在線上學會大數(shù)據(jù)技術(shù)的話,那么你就不需要培訓了,通過自學就可以了!因為你屬于學習能力強的那一小部分人
華晨1234
1.大數(shù)據(jù)工程師工作中會做什么?集群運維:安裝、測試、運維各種大數(shù)據(jù)組件數(shù)據(jù)開發(fā):細分一點的話會有ETL工程師、數(shù)據(jù)倉庫工程師等數(shù)據(jù)系統(tǒng)開發(fā):偏重Web系統(tǒng)開發(fā),比如報表系統(tǒng)、推薦系統(tǒng)等這里面有很多內(nèi)容其實是十分重合的,下面大致聊一下每一塊內(nèi)容大致需要學什么,以及側(cè)重點。2.集群運維數(shù)據(jù)工程師,基本上是離不開集群搭建,比如hadoop、Spark、Kafka,不要指望有專門的運維幫你搞定,新組件的引入一般都要自己來動手的。因此這就要求數(shù)據(jù)工程師了解各種大數(shù)據(jù)的組件。由于要自己的安裝各種開源的組件,就要求數(shù)據(jù)工程師要具備的能力: Linux 。要對Linux比較熟悉,能各種自己折騰著玩。由于現(xiàn)在的大數(shù)據(jù)生態(tài)系統(tǒng)基本上是 JVM系的,因此在語言上,就不要猶豫了,JVM系的Java和Scala基本上跑不掉,Java基本上要學的很深,Scala就看情況了。3. ETLETL在大數(shù)據(jù)領域主要體現(xiàn)在各種數(shù)據(jù)流的處理。這一塊一方面體現(xiàn)在對一些組件的了解上,比如Sqoop、Flume、Kafka、Spark、MapReduce;另一方面就是編程語言的需要,Java、Shell和Sql是基本功。4.系統(tǒng)開發(fā)我們大部分的價值最后都會由系統(tǒng)來體現(xiàn),比如報表系統(tǒng)和推薦系統(tǒng)。因此就要求有一定的系統(tǒng)開發(fā)能力,最常用的就是 Java Web這一套了,當然Python也是挺方便的。需要注意的是,一般數(shù)據(jù)開發(fā)跑不掉的就是各種提數(shù)據(jù)的需求,很多是臨時和定制的需求,這種情況下, Sql就跑不掉了,老老實實學一下Sql很必要。如何入門?前面提到了一些數(shù)據(jù)工程師會用到的技能樹,下面給一個入門的建議,完全個人意見。1.了解行業(yè)情況剛開始一定要了解清楚自己和行業(yè)的情況,很多人根本就分不清招聘信息中的大數(shù)據(jù)和數(shù)據(jù)挖掘的區(qū)別就說自己要轉(zhuǎn)行,其實是很不負責的。不要總是趕熱點,反正我就是經(jīng)常被鄙視做什么大數(shù)據(jù)開發(fā)太Low,做數(shù)據(jù)就要做數(shù)據(jù)挖掘,不然永遠都是水貨。2.選擇學習途徑如果真是清楚自己明確地想轉(zhuǎn)數(shù)據(jù)開發(fā)了,要考慮一下自己的時間和精力,能拿出來多少時間,而且在學習的時候最好有人能多指點下,不然太容易走彎路了。在選擇具體的學習途徑時,要慎重一點,有幾個選擇:自學報班找人指點別的不說了,報班是可以考慮的,不要全指望報個輔導班就能帶你上天,但是可以靠他幫你梳理思路。如果有專業(yè)從事這一行的人多幫幫的話,是最好的。不一定是技術(shù)好,主要是可溝通性強。3.學習路線學習路線,下面是一個大致的建議:第一階段先具備一定的Linux和Java的基礎,不一定要特別深,先能玩起來,Linux的話能自己執(zhí)行各種操作,Java能寫點小程序。這些事為搭建Hadoop環(huán)境做準備。學習Hadoop,學會搭建單機版的Hadoop,然后是分布式的Hadoop,寫一些MR的程序。接著學學Hadoop生態(tài)系統(tǒng)的其它大數(shù)據(jù)組件,比如Spark、Hive、Hbase,嘗試去搭建然后跑一些官網(wǎng)的Demo。Linux、Java、各種組件都有一些基礎后,要有一些項目方面的實踐,這時候找一些成功案例,比如搜搜各種視頻教程中如何搞一個推薦系統(tǒng),把自己學到的用起來。第二階段到這里是一個基本的階段了,大致對數(shù)據(jù)開發(fā)有一些了解了。接著要有一些有意思內(nèi)容可以選學。數(shù)據(jù)倉庫體系:如何搞數(shù)據(jù)分層,數(shù)據(jù)倉庫體系該如何建設,可以有一些大致的了解。用戶畫像和特征工程:這一部分越早了解越好。一些系統(tǒng)的實現(xiàn)思路:比如調(diào)度系統(tǒng)、元數(shù)據(jù)系統(tǒng)、推薦系統(tǒng)這些系統(tǒng)如何實現(xiàn)。第三階段下面要有一些細分的領域需要深入進行,看工作和興趣來選擇一些來深入進行分布式理論:比如Gossip、DHT、Paxo這些構(gòu)成了各種分布式系統(tǒng)的底層協(xié)議和算法,還是要學一下的。數(shù)據(jù)挖掘算法:算法是要學的,但是不一定純理論,在分布式環(huán)境中實現(xiàn)算法,本身就是一個大的挑戰(zhàn)。各種系統(tǒng)的源碼學習:比如Hadoop、Spark、Kafka的源碼,想深入搞大數(shù)據(jù),源碼跑不掉。
搖滾喵喵
一般來說大數(shù)據(jù)培訓就是5個月左右的時間,
大數(shù)據(jù)學習內(nèi)容
第1階段Java
第2階段JavaEE核心
第3階段Hadoop生態(tài)體系
第4階段大數(shù)據(jù)spark生態(tài)體系
大數(shù)據(jù)學習內(nèi)容
優(yōu)質(zhì)工程師考試問答知識庫