騰瑞水暖衛(wèi)浴
大數(shù)據(jù)是眾多學(xué)科與統(tǒng)計學(xué)交叉產(chǎn)生的一門新興學(xué)科。大數(shù)據(jù)牽扯的數(shù)據(jù)挖掘、云計算一類的,所以是計算機一類的專業(yè)。分布比較廣,應(yīng)用行業(yè)較多。
零售業(yè):主要集中在客戶營銷分析上,通過大數(shù)據(jù)技術(shù)可以對客戶的消費信息進行分析。獲知客戶的消費習(xí)慣、消費方向等,以便商場做好更合理商品、貨架擺放,規(guī)劃市場營銷方案、產(chǎn)品推薦手段等。
金融業(yè):在金融行業(yè)里頭,數(shù)據(jù)即是生命,其信息系統(tǒng)中積累了大量客戶的交易數(shù)據(jù)。通過大數(shù)據(jù)可以對客戶的行為進行分析、防堵詐騙、金融風(fēng)險分析等。
醫(yī)療業(yè):通過大數(shù)據(jù)可以輔助分析疫情信息,對應(yīng)做出相應(yīng)的防控措施。對人體健康的趨勢分析在電子病歷、醫(yī)學(xué)研發(fā)和臨床試驗中,可提高診斷準(zhǔn)確性和藥物有效性等。
制造業(yè):該行業(yè)對大數(shù)據(jù)的需求主要體現(xiàn)在產(chǎn)品研發(fā)與設(shè)計、供應(yīng)鏈管理、生產(chǎn)、售后服務(wù)等。通過數(shù)據(jù)分析,在產(chǎn)品研發(fā)過程中免除掉一些不必要的步驟,并且及時改善產(chǎn)品的制造與組裝的流程。
張小天11
大數(shù)據(jù)前景是很不錯的,像大數(shù)據(jù)這樣的專業(yè)還是一線城市比較好,師資力量跟得上、就業(yè)的薪資也是可觀的,學(xué)習(xí)大數(shù)據(jù)可以按照路線圖的順序,
學(xué)大數(shù)據(jù)關(guān)鍵是找到靠譜的大數(shù)據(jù)培訓(xùn)機構(gòu),你可以深度了解機構(gòu)的口碑情況,問問周圍知道這家機構(gòu)的人,除了口碑再了解機構(gòu)的以下幾方面:
1.?師資力量雄厚
要想有1+1>2的實際效果,很關(guān)鍵的一點是師資隊伍,你接下來無論是找個工作還是工作中出任哪些的人物角色,都越來越愛你本身的技術(shù)專業(yè)大數(shù)據(jù)技術(shù)性,也許的技術(shù)專業(yè)大數(shù)據(jù)技術(shù)性則絕大多數(shù)來自你的技術(shù)專業(yè)大數(shù)據(jù)教師,一個好的大數(shù)據(jù)培訓(xùn)機構(gòu)必須具備雄厚的師資力量。
2. 就業(yè)保障完善
實現(xiàn)1+1>2效果的關(guān)鍵在于能夠為你提供良好的發(fā)展平臺,即能夠為你提供良好的就業(yè)保障,讓學(xué)員能夠?qū)W到實在實在的知識,并向大數(shù)據(jù)學(xué)員提供一對一的就業(yè)指導(dǎo),確保學(xué)員找到自己的心理工作。
3. 學(xué)費性價比高
一個好的大數(shù)據(jù)培訓(xùn)機構(gòu)肯定能給你帶來1+1>2的效果,如果你在一個由專業(yè)的大數(shù)據(jù)教師領(lǐng)導(dǎo)并由大數(shù)據(jù)培訓(xùn)機構(gòu)自己提供的平臺上工作,你將獲得比以往更多的投資。
希望你早日學(xué)有所成。
smiley0603
大數(shù)據(jù)分析偏產(chǎn)品職位,一般不是技術(shù)崗位。技術(shù)崗位叫數(shù)據(jù)挖掘,又分為做模型和用模型的。做模型對數(shù)據(jù)要求非常高,如果自己不是這塊料那就別去做,又痛苦又做不出東西來;絕大多數(shù)數(shù)據(jù)挖掘都是用模型,這個門檻就低多了。另外還有專門做大數(shù)據(jù)平臺的,比如hadoop,spark這些,偏工程。
大琳琳666
1.大數(shù)據(jù)工程師工作中會做什么?集群運維:安裝、測試、運維各種大數(shù)據(jù)組件數(shù)據(jù)開發(fā):細(xì)分一點的話會有ETL工程師、數(shù)據(jù)倉庫工程師等數(shù)據(jù)系統(tǒng)開發(fā):偏重Web系統(tǒng)開發(fā),比如報表系統(tǒng)、推薦系統(tǒng)等這里面有很多內(nèi)容其實是十分重合的,下面大致聊一下每一塊內(nèi)容大致需要學(xué)什么,以及側(cè)重點。2.集群運維數(shù)據(jù)工程師,基本上是離不開集群搭建,比如hadoop、Spark、Kafka,不要指望有專門的運維幫你搞定,新組件的引入一般都要自己來動手的。因此這就要求數(shù)據(jù)工程師了解各種大數(shù)據(jù)的組件。由于要自己的安裝各種開源的組件,就要求數(shù)據(jù)工程師要具備的能力: Linux 。要對Linux比較熟悉,能各種自己折騰著玩。由于現(xiàn)在的大數(shù)據(jù)生態(tài)系統(tǒng)基本上是 JVM系的,因此在語言上,就不要猶豫了,JVM系的Java和Scala基本上跑不掉,Java基本上要學(xué)的很深,Scala就看情況了。3. ETLETL在大數(shù)據(jù)領(lǐng)域主要體現(xiàn)在各種數(shù)據(jù)流的處理。這一塊一方面體現(xiàn)在對一些組件的了解上,比如Sqoop、Flume、Kafka、Spark、MapReduce;另一方面就是編程語言的需要,Java、Shell和Sql是基本功。4.系統(tǒng)開發(fā)我們大部分的價值最后都會由系統(tǒng)來體現(xiàn),比如報表系統(tǒng)和推薦系統(tǒng)。因此就要求有一定的系統(tǒng)開發(fā)能力,最常用的就是 Java Web這一套了,當(dāng)然Python也是挺方便的。需要注意的是,一般數(shù)據(jù)開發(fā)跑不掉的就是各種提數(shù)據(jù)的需求,很多是臨時和定制的需求,這種情況下, Sql就跑不掉了,老老實實學(xué)一下Sql很必要。如何入門?前面提到了一些數(shù)據(jù)工程師會用到的技能樹,下面給一個入門的建議,完全個人意見。1.了解行業(yè)情況剛開始一定要了解清楚自己和行業(yè)的情況,很多人根本就分不清招聘信息中的大數(shù)據(jù)和數(shù)據(jù)挖掘的區(qū)別就說自己要轉(zhuǎn)行,其實是很不負(fù)責(zé)的。不要總是趕熱點,反正我就是經(jīng)常被鄙視做什么大數(shù)據(jù)開發(fā)太Low,做數(shù)據(jù)就要做數(shù)據(jù)挖掘,不然永遠(yuǎn)都是水貨。2.選擇學(xué)習(xí)途徑如果真是清楚自己明確地想轉(zhuǎn)數(shù)據(jù)開發(fā)了,要考慮一下自己的時間和精力,能拿出來多少時間,而且在學(xué)習(xí)的時候最好有人能多指點下,不然太容易走彎路了。在選擇具體的學(xué)習(xí)途徑時,要慎重一點,有幾個選擇:自學(xué)報班找人指點別的不說了,報班是可以考慮的,不要全指望報個輔導(dǎo)班就能帶你上天,但是可以靠他幫你梳理思路。如果有專業(yè)從事這一行的人多幫幫的話,是最好的。不一定是技術(shù)好,主要是可溝通性強。3.學(xué)習(xí)路線學(xué)習(xí)路線,下面是一個大致的建議:第一階段先具備一定的Linux和Java的基礎(chǔ),不一定要特別深,先能玩起來,Linux的話能自己執(zhí)行各種操作,Java能寫點小程序。這些事為搭建Hadoop環(huán)境做準(zhǔn)備。學(xué)習(xí)Hadoop,學(xué)會搭建單機版的Hadoop,然后是分布式的Hadoop,寫一些MR的程序。接著學(xué)學(xué)Hadoop生態(tài)系統(tǒng)的其它大數(shù)據(jù)組件,比如Spark、Hive、Hbase,嘗試去搭建然后跑一些官網(wǎng)的Demo。Linux、Java、各種組件都有一些基礎(chǔ)后,要有一些項目方面的實踐,這時候找一些成功案例,比如搜搜各種視頻教程中如何搞一個推薦系統(tǒng),把自己學(xué)到的用起來。第二階段到這里是一個基本的階段了,大致對數(shù)據(jù)開發(fā)有一些了解了。接著要有一些有意思內(nèi)容可以選學(xué)。數(shù)據(jù)倉庫體系:如何搞數(shù)據(jù)分層,數(shù)據(jù)倉庫體系該如何建設(shè),可以有一些大致的了解。用戶畫像和特征工程:這一部分越早了解越好。一些系統(tǒng)的實現(xiàn)思路:比如調(diào)度系統(tǒng)、元數(shù)據(jù)系統(tǒng)、推薦系統(tǒng)這些系統(tǒng)如何實現(xiàn)。第三階段下面要有一些細(xì)分的領(lǐng)域需要深入進行,看工作和興趣來選擇一些來深入進行分布式理論:比如Gossip、DHT、Paxo這些構(gòu)成了各種分布式系統(tǒng)的底層協(xié)議和算法,還是要學(xué)一下的。數(shù)據(jù)挖掘算法:算法是要學(xué)的,但是不一定純理論,在分布式環(huán)境中實現(xiàn)算法,本身就是一個大的挑戰(zhàn)。各種系統(tǒng)的源碼學(xué)習(xí):比如Hadoop、Spark、Kafka的源碼,想深入搞大數(shù)據(jù),源碼跑不掉。
黑暗中的精靈88
大數(shù)據(jù)基礎(chǔ)知識:
有三個主要部分,分別是數(shù)學(xué)、統(tǒng)計學(xué)和計算機等學(xué)科。大數(shù)據(jù)基礎(chǔ)知識往往決定了開發(fā)人員未來的成長高度,所以要重視基礎(chǔ)知識的學(xué)習(xí)。
大數(shù)據(jù)平臺知識:
是大數(shù)據(jù)開發(fā)的基礎(chǔ),在學(xué)習(xí)期間,往往以搭建Hadoop、Spark平臺為主,一方面Hadoop對機器的硬件要求不高,另一方面Hadoop的使用也非常普遍,很多商業(yè)大數(shù)據(jù)平臺都是基于Hadoop構(gòu)建的。大數(shù)據(jù)的核心是數(shù)據(jù)價值化。
大數(shù)據(jù)場景知識:
是目前大數(shù)據(jù)的重要應(yīng)用,這些場景包括很多領(lǐng)域,比如金融大數(shù)據(jù)、交通大數(shù)據(jù)、教育大數(shù)據(jù)、餐飲大數(shù)據(jù)等等,這些場景應(yīng)用的背后也需要對行業(yè)知識有一定的了解。
優(yōu)質(zhì)工程師考試問答知識庫