青檸果茶
零基礎(chǔ)開始學(xué)習(xí)的話,大概需要5個月左右。大數(shù)據(jù)挖掘工程師的課程內(nèi)容涉獵很多,包括JavaSE 開發(fā)、JavaEE開發(fā)、并發(fā)編程實(shí)戰(zhàn)開發(fā)、Linux精講、Hadoop 生態(tài)體系、Python 實(shí)戰(zhàn)開發(fā)、Storm 實(shí)時開發(fā)、Spark 生態(tài)體系、ElasticSearc、Docker容器引擎、機(jī)器學(xué)習(xí)、超大集群調(diào)優(yōu)、大數(shù)據(jù)項(xiàng)目實(shí)戰(zhàn)等。如果想要全部掌握以上的知識,必須要進(jìn)行系統(tǒng)的學(xué)習(xí),建議報名相關(guān)的專業(yè)機(jī)構(gòu)進(jìn)行線上或者線下課程的學(xué)習(xí)。同時,學(xué)成之后大數(shù)據(jù)工程師的就業(yè)前景還是很明朗的,在薪酬待遇也是很有優(yōu)勢的,因?yàn)榇髷?shù)據(jù)工程師在IT類職業(yè)中比較稀缺的,收入待遇可以說達(dá)到了同類的頂級。國內(nèi)IT、通訊、行業(yè)招聘中,有10%都是和大數(shù)據(jù)相關(guān)的,且比例還在上升。想要了解更多有關(guān)數(shù)據(jù)挖掘的信息,可以了解一下CDA數(shù)據(jù)分析師的課程。課程內(nèi)容兼顧培養(yǎng)解決數(shù)據(jù)挖掘流程問題的橫向能力以及解決數(shù)據(jù)挖掘算法問題的縱向能力。要求學(xué)生具備從數(shù)據(jù)治理根源出發(fā)的思維,通過數(shù)字化工作方法來探查業(yè)務(wù)問題,通過近因分析、宏觀根因分析等手段,再選擇業(yè)務(wù)流程優(yōu)化工具還是算法工具,而非“遇到問題調(diào)算法包”
簡單已逝
這個要看你在哪個城市了,每個城市所存在的機(jī)構(gòu)都不一樣。最好選擇覆蓋地區(qū)廣的,比較權(quán)威的培訓(xùn)機(jī)構(gòu)。大數(shù)據(jù)的專業(yè)要求很高。目前敢培訓(xùn)大數(shù)據(jù)的學(xué)校都是具備一定專業(yè)性的,主要看看是否能提供真實(shí)的案例來供學(xué)生們分析來進(jìn)行專業(yè)性的判斷。多看看網(wǎng)絡(luò)上的口碑。找到真正適合自己的培訓(xùn)機(jī)構(gòu)。需要掌握的專業(yè)技術(shù):堅實(shí)的Java技術(shù)作為基礎(chǔ)支持,之后學(xué)習(xí):Hadoop,大數(shù)據(jù)存儲,大數(shù)據(jù)架構(gòu)設(shè)計,大數(shù)據(jù)實(shí)時計算,大數(shù)據(jù)數(shù)據(jù)采集,大數(shù)據(jù)商業(yè)實(shí)戰(zhàn)等。技術(shù)人員就業(yè)方向:大數(shù)據(jù)系統(tǒng)研發(fā)人才,大數(shù)據(jù)應(yīng)用開發(fā)人才和大數(shù)據(jù)分析人才。
空山青雨
入行大數(shù)據(jù)分析師必備技能有哪些?大數(shù)據(jù)分析師需要每天使用各種不同的技能;從深入分析到數(shù)據(jù)可視化和講故事的一切。您將在一分鐘內(nèi)編寫一個SQL查詢來探索數(shù)據(jù)集,而下一分鐘您將站在董事會面前,概述業(yè)務(wù)如何根據(jù)您的發(fā)現(xiàn)進(jìn)行調(diào)整。
在介紹了大數(shù)據(jù)分析師和數(shù)據(jù)科學(xué)家之間的差異,大數(shù)據(jù)分析師的薪水以及剛起步的人員的一些關(guān)鍵大數(shù)據(jù)分析術(shù)語之后,我們現(xiàn)在將探討與成為大數(shù)據(jù)分析師相關(guān)的關(guān)鍵技能。您可能已經(jīng)擁有一些技能,因?yàn)樗鼈兒w了涉及溝通,分析和解決問題的廣泛技能。
在入行大數(shù)據(jù)分析師必備技能有哪些文章中,我們將深入了解成為大數(shù)據(jù)分析師的意義。AAA教育目前正在提供一個簡短的大數(shù)據(jù)分析課程,該課程的重點(diǎn)之一是掌握Microsoft Excel(分析的關(guān)鍵工具)的基礎(chǔ)知識。這是對大數(shù)據(jù)分析的清晰易懂的介紹,它將教您與成為大數(shù)據(jù)分析師相關(guān)的核心技能之一。它還會輕而易舉地消除您可能對該領(lǐng)域是否適用存在的任何疑問:是的,您也可以成為大數(shù)據(jù)分析師!
成為大數(shù)據(jù)分析師:您需要的關(guān)鍵技能
優(yōu)秀的解決問題能力
扎實(shí)的數(shù)字技能
Excel熟練程度和查詢語言知識
數(shù)據(jù)可視化方面的專業(yè)知識
良好的溝通能力
關(guān)鍵要點(diǎn)
1.優(yōu)秀的解決問題能力
解決問題是大數(shù)據(jù)分析師應(yīng)具備的最重要技能之一。大約90%的分析與批判性思維有關(guān),并且知道要提出的正確問題。如果您提出的問題基于對業(yè)務(wù),產(chǎn)品和行業(yè)的了解,那么您將獲得所需的答案。大數(shù)據(jù)分析就是要提出一個問題(即“為什么我們不賣更多的紅色自行車?”),并執(zhí)行必要的調(diào)查任務(wù)以找到答案。
大數(shù)據(jù)分析主要涉及對遇到的問題進(jìn)行邏輯思考。如果您熟悉數(shù)據(jù)的挑戰(zhàn)和細(xì)微差別,您將更快地得出正確的結(jié)論。如果紅色自行車賣得不好,那為什么會這樣呢?是因?yàn)槠渌伾姆秶髥?紅色自行車的價格通常高于其他自行車嗎?紅色自行車是否僅以山地自行車形式提供,因此不鼓勵城市居民購買?大數(shù)據(jù)分析師通過使用他們的邏輯來理解數(shù)據(jù)可以更快地得出結(jié)論。
2.扎實(shí)的數(shù)字技能
許多大數(shù)據(jù)分析師并非來自數(shù)字世界,通常是來自業(yè)務(wù)或營銷背景。隨著您的發(fā)展,完全有可能增加對這一領(lǐng)域的了解。雖然不一定是“技能”,但對于任何有抱負(fù)的大數(shù)據(jù)分析師來說,擁有數(shù)字天賦無疑是一件好事。您需要從正規(guī)教育或其他經(jīng)驗(yàn)中獲得一定程度的數(shù)字專業(yè)知識。您可以學(xué)習(xí)與大數(shù)據(jù)分析相關(guān)的大多數(shù)數(shù)字技能,例如回歸分析,它涉及檢查兩個或多個變量及其關(guān)系,而無需回到學(xué)校。
在統(tǒng)計方面有充分的基礎(chǔ)也是有益的。您需要對查詢有所了解,查詢是計算機(jī)用來執(zhí)行任務(wù)的命令。在分析中,這些命令用于從數(shù)據(jù)集中提取信息。精通應(yīng)用科學(xué)和線性代數(shù)的知識將使您更輕松,盡管如果這對您來說還是個謎,請不要放任。
3.精通Excel和查詢語言知識
如前所述,Microsoft Excel的知識是有效大數(shù)據(jù)分析的一項(xiàng)基本技能。這是一個電子表格程序,全球數(shù)百萬人使用它來存儲和共享信息,執(zhí)行數(shù)學(xué)和統(tǒng)計運(yùn)算以及創(chuàng)建總結(jié)重要發(fā)現(xiàn)的報告和可視化效果。對于大數(shù)據(jù)分析人員來說,它是一個強(qiáng)大的工具,可用于快速訪問,組織和處理數(shù)據(jù)以獲取和共享見解。大數(shù)據(jù)分析師每天都會使用Excel,因此您將必須從數(shù)據(jù)透視表中真正了解您的VLOOKUP。是否想找出紅色自行車賣得最多的地方?好奇紅色自行車的平均價格是否高于藍(lán)色自行車?Excel可以幫助提供此類問題的答案。
除Excel之外,分析人員還需要熟悉至少一種查詢語言。這些語言用于指示計算機(jī)執(zhí)行特定任務(wù),包括許多與大數(shù)據(jù)分析有關(guān)的任務(wù)。用于大數(shù)據(jù)分析的最受歡迎的語言是SQL和SAS,而諸如Python和R之類的編程語言則具有各種專用于分析數(shù)據(jù)的強(qiáng)大程序。
許多可用的語言執(zhí)行不同的功能或適應(yīng)某一特定行業(yè)。SAS主要用于醫(yī)療行業(yè),而SQL通常用于從數(shù)據(jù)庫檢索數(shù)據(jù)。如果您對自己想從事的行業(yè)有所了解,那么進(jìn)行一些研究并找出它們使用的語言是有益的-為您最感興趣的行業(yè)量身定制學(xué)習(xí)是一個明智的舉動。
4.數(shù)據(jù)可視化方面的專業(yè)知識
很難處理一個復(fù)雜的主題并以簡單的方式介紹發(fā)現(xiàn)的結(jié)果,但這正是大數(shù)據(jù)分析師的工作!這是關(guān)于將您的發(fā)現(xiàn)轉(zhuǎn)化為易于消化的信息塊。用數(shù)據(jù)講述一個引人入勝的故事至關(guān)重要,而其中很多都涉及視覺輔助工具的使用。圖形和餅圖是說明數(shù)據(jù)發(fā)現(xiàn)的一種流行且極為有效的方法。
Microsoft Excel和Tableau都擁有大量用于可視化數(shù)據(jù)的選項(xiàng),使您能夠以準(zhǔn)確的方式顯示結(jié)果。該技能在于知道如何最好地呈現(xiàn)數(shù)據(jù),以便您的發(fā)現(xiàn)自己說話。技術(shù)專業(yè)人員之間傾向于用復(fù)雜而深奧的語言說話,但是要成為一名出色的大數(shù)據(jù)分析師,就是要通過簡單的可視化輕松,有效地傳達(dá)發(fā)現(xiàn)。
5.良好的溝通能力
除了能夠可視化您的發(fā)現(xiàn)之外,大數(shù)據(jù)分析師還必須能夠口頭交流發(fā)現(xiàn)的結(jié)果。大數(shù)據(jù)分析師與利益相關(guān)者,同事和數(shù)據(jù)供應(yīng)商不斷合作,因此良好的溝通技巧至關(guān)重要。你和別人說話有多好?您可以有效地將技術(shù)信息分解為簡單的單詞嗎?這是與數(shù)據(jù)可視化緊密相關(guān)的一項(xiàng)關(guān)鍵技能,這一切都在交付中!
相關(guān)推薦:
2020年UI設(shè)計調(diào)色板趨勢
入行大數(shù)據(jù)分析師必備技能有哪些
為什么要學(xué)大數(shù)據(jù)分析
大數(shù)據(jù)分析培訓(xùn)課程內(nèi)容有哪些
大數(shù)據(jù)預(yù)測分析在企業(yè)規(guī)劃中的價值
大數(shù)據(jù)分析取得的成果有哪些
大數(shù)據(jù)分析培訓(xùn)課程大綱
大數(shù)據(jù)分析師工資待遇
淘氣別鬧
據(jù)統(tǒng)計,我國電子商務(wù)企業(yè)已達(dá)到1000多萬家,其中大中型企業(yè)就有10萬多家,初步估計,未來我國對電子商務(wù)人才的需求每年約80萬人,而我國目前包括高校和各類培訓(xùn)機(jī)構(gòu)每年輸出的人才數(shù)量不到10萬人。人才缺口巨大已成為制約我國電商行業(yè)發(fā)展的一大瓶頸。 選擇江西新華電腦學(xué)院云電商工程師專業(yè),你將學(xué)習(xí):電子商務(wù)概論與政策法規(guī)、Photoshop圖像處理、電子商務(wù)物流管理、HTML5+CSS3、WEB和移動界面商業(yè)案例、Windows Server2003服務(wù)器操作系統(tǒng)、動態(tài)網(wǎng)頁設(shè)計PHPMYSQL、網(wǎng)絡(luò)數(shù)據(jù)庫基礎(chǔ)(SQLServer)、JavaScript、電子商務(wù)安全與網(wǎng)上支付、百度SEM、SEO優(yōu)化與推廣、網(wǎng)絡(luò)營銷及綜合實(shí)踐等。
kisscat0317
大數(shù)據(jù)工程師做什么?需要具備什么能力?大數(shù)據(jù)是眼下非常時髦的技術(shù)名詞,與此同時自然也催生出了一些與大數(shù)據(jù)處理相關(guān)的職業(yè),通過對數(shù)據(jù)的挖掘分析來影響企業(yè)的商業(yè)決策。這群人在國外被叫做數(shù)據(jù)科學(xué)家(Data Scientist),這個頭銜最早由和Jeff Hammerbacher于2008年提出,他們后來分別成為了領(lǐng)英(LinkedIn)和Facebook數(shù)據(jù)科學(xué)團(tuán)隊(duì)的負(fù)責(zé)人。而數(shù)據(jù)科學(xué)家這個職位目前也已經(jīng)在美國傳統(tǒng)的電信、零售、金融、制造、物流、醫(yī)療、教育等行業(yè)里開始創(chuàng)造價值。不過在國內(nèi),大數(shù)據(jù)的應(yīng)用才剛剛萌芽,人才市場還不那么成熟,“你很難期望有一個全才來完成整個鏈條上的所有環(huán)節(jié)。更多公司會根據(jù)自己已有的資源和短板,招聘能和現(xiàn)有團(tuán)隊(duì)互補(bǔ)的人才?!鳖I(lǐng)英(LinkedIn)中國商務(wù)分析及戰(zhàn)略總監(jiān)王昱堯?qū)Α兜谝回斀?jīng)周刊》說。于是每家公司對大數(shù)據(jù)工作的要求不盡相同:有的強(qiáng)調(diào)數(shù)據(jù)庫編程、有的突出應(yīng)用數(shù)學(xué)和統(tǒng)計學(xué)知識、有的則要求有咨詢公司或投行相關(guān)的經(jīng)驗(yàn)、有些是希望能找到懂得產(chǎn)品和市場的應(yīng)用型人才。正因?yàn)槿绱?,很多公司會針對自己的業(yè)務(wù)類型和團(tuán)隊(duì)分工,給這群與大數(shù)據(jù)打交道的人一些新的頭銜和定義:數(shù)據(jù)挖掘工程師、大數(shù)據(jù)專家、數(shù)據(jù)研究員、用戶分析專家等都是經(jīng)常在國內(nèi)公司里出現(xiàn)的Title,我們將其統(tǒng)稱為“大數(shù)據(jù)工程師”。王昱堯認(rèn)為,在一個成熟的數(shù)據(jù)驅(qū)動型公司,“大數(shù)據(jù)工程師”往往是一個團(tuán)隊(duì),它意味著從數(shù)據(jù)的收集、整理展現(xiàn)、分析和商業(yè)洞察、以至于市場轉(zhuǎn)化的全過程。這個團(tuán)隊(duì)中可能包括數(shù)據(jù)工程師、分析師、產(chǎn)品專員、市場專員和商業(yè)決策者等角色,共同完成從原始數(shù)據(jù)到商業(yè)價值的轉(zhuǎn)換—概括來講,這是一個支持企業(yè)做出商業(yè)決策、發(fā)掘商業(yè)模式的重要群體。由于國內(nèi)的大數(shù)據(jù)工作還處在一個有待開發(fā)的階段,因此能從其中挖掘出多少價值完全取決于工程師的個人能力。已經(jīng)身處這個行業(yè)的專家給出了一些人才需求的大體框架,包括要有計算機(jī)編碼能力、數(shù)學(xué)及統(tǒng)計學(xué)相關(guān)背景,當(dāng)然如果能對一些特定領(lǐng)域或行業(yè)有比較深入的了解,對于其快速判斷并抓準(zhǔn)關(guān)鍵因素則更有幫助。雖然對于一些大公司來說,擁有碩博學(xué)歷的公司人是比較好的選擇,不過阿里巴巴集團(tuán)研究員薛貴榮強(qiáng)調(diào),學(xué)歷并不是最主要的因素,能有大規(guī)模處理數(shù)據(jù)的經(jīng)驗(yàn)并且有喜歡在數(shù)據(jù)海洋中尋寶的好奇心會更適合這個工作。除此之外,一個優(yōu)秀的大數(shù)據(jù)工程師要具備一定的邏輯分析能力,并能迅速定位某個商業(yè)問題的關(guān)鍵屬性和決定因素。“他得知道什么是相關(guān)的,哪個是重要的,使用什么樣的數(shù)據(jù)是最有價值的,如何快速找到每個業(yè)務(wù)最核心的需求?!甭?lián)合國百度大數(shù)據(jù)聯(lián)合實(shí)驗(yàn)室數(shù)據(jù)科學(xué)家沈志勇說。學(xué)習(xí)能力能幫助大數(shù)據(jù)工程師快速適應(yīng)不同的項(xiàng)目,并在短時間內(nèi)成為這個領(lǐng)域的數(shù)據(jù)專家;溝通能力則能讓他們的工作開展地更順利,因?yàn)榇髷?shù)據(jù)工程師的工作主要分為兩種方式:由市場部驅(qū)動和由數(shù)據(jù)分析部門驅(qū)動,前者需要常常向產(chǎn)品經(jīng)理了解開發(fā)需求,后者則需要找運(yùn)營部了解數(shù)據(jù)模型實(shí)際轉(zhuǎn)化的情況。你可以將以上這些要求看做是成為大數(shù)據(jù)工程師的努力方向,因?yàn)楦鶕?jù)萬寶瑞華管理合伙人顏莉萍的觀察,這是一個很大的人才缺口。目前國內(nèi)的大數(shù)據(jù)應(yīng)用多集中在互聯(lián)網(wǎng)領(lǐng)域,有超過56%的企業(yè)在籌備發(fā)展大數(shù)據(jù)研究,“未來5年,94%的公司都會需要數(shù)據(jù)科學(xué)家。”顏莉萍說。因此她也建議一些原本從事與數(shù)據(jù)工作相關(guān)的公司人可以考慮轉(zhuǎn)型。本期《第一財經(jīng)周刊》采訪了BAT這3家國內(nèi)互聯(lián)網(wǎng)公司,以及相關(guān)領(lǐng)域的人力資源專家,他們從職場角度為我們解讀如何成為大數(shù)據(jù)工程師以及這類崗位的職場現(xiàn)狀。A 大數(shù)據(jù)工程師做什么?用阿里巴巴集團(tuán)研究員薛貴榮的話來說,大數(shù)據(jù)工程師就是一群“玩數(shù)據(jù)”的人,玩出數(shù)據(jù)的商業(yè)價值,讓數(shù)據(jù)變成生產(chǎn)力。大數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)的最大區(qū)別在于,它是在線的、實(shí)時的,規(guī)模海量且形式不規(guī)整,無章法可循,因此“會玩”這些數(shù)據(jù)的人就很重要。沈志勇認(rèn)為如果把大數(shù)據(jù)想象成一座不停累積的礦山,那么大數(shù)據(jù)工程師的工作就是,“第一步,定位并抽取信息所在的數(shù)據(jù)集,相當(dāng)于探礦和采礦。第二步,把它變成直接可以做判斷的信息,相當(dāng)于冶煉。最后是應(yīng)用,把數(shù)據(jù)可視化等?!币虼朔治鰵v史、預(yù)測未來、優(yōu)化選擇,這是大數(shù)據(jù)工程師在“玩數(shù)據(jù)”時最重要的三大任務(wù)。通過這三個工作方向,他們幫助企業(yè)做出更好的商業(yè)決策。找出過去事件的特征大數(shù)據(jù)工程師一個很重要的工作,就是通過分析數(shù)據(jù)來找出過去事件的特征。比如,騰訊的數(shù)據(jù)團(tuán)隊(duì)正在搭建一個數(shù)據(jù)倉庫,把公司所有網(wǎng)絡(luò)平臺上數(shù)量龐大、不規(guī)整的數(shù)據(jù)信息進(jìn)行梳理,總結(jié)出可供查詢的特征,來支持公司各類業(yè)務(wù)對數(shù)據(jù)的需求,包括廣告投放、游戲開發(fā)、社交網(wǎng)絡(luò)等。找出過去事件的特征,最大的作用是可以幫助企業(yè)更好地認(rèn)識消費(fèi)者。通過分析用戶以往的行為軌跡,就能夠了解這個人,并預(yù)測他的行為?!澳憧梢灾浪鞘裁礃拥娜恕⑺哪昙o(jì)、興趣愛好,是不是互聯(lián)網(wǎng)付費(fèi)用戶、喜歡玩什么類型的游戲,平常喜歡在網(wǎng)上做什么事情?!彬v訊云計算有限公司北京研發(fā)中心總經(jīng)理鄭立峰對《第一財經(jīng)周刊》說。下一步到了業(yè)務(wù)層面,就可以針對各類人群推薦相關(guān)服務(wù),比如手游,或是基于不同特征和需求衍生出新的業(yè)務(wù)模式,比如微信的電影票業(yè)務(wù)。預(yù)測未來可能發(fā)生的事情通過引入關(guān)鍵因素,大數(shù)據(jù)工程師可以預(yù)測未來的消費(fèi)趨勢。在阿里媽媽的營銷平臺上,工程師正試圖通過引入氣象數(shù)據(jù)來幫助淘寶賣家做生意。“比如今年夏天不熱,很可能某些產(chǎn)品就沒有去年暢銷,除了空調(diào)、電扇,背心、游泳衣等都可能會受其影響。那么我們就會建立氣象數(shù)據(jù)和銷售數(shù)據(jù)之間的關(guān)系,找到與之相關(guān)的品類,提前警示賣家周轉(zhuǎn)庫存?!毖F榮說。在百度,沈志勇支持“百度預(yù)測”部分產(chǎn)品的模型研發(fā),試圖用大數(shù)據(jù)為更廣泛的人群服務(wù)。已經(jīng)上線的包括世界杯預(yù)測、高考預(yù)測、景點(diǎn)預(yù)測等。以百度景點(diǎn)預(yù)測為例,大數(shù)據(jù)工程師需要收集所有可能影響一段時間內(nèi)景點(diǎn)人流量的關(guān)鍵因素進(jìn)行預(yù)測,并為全國各個景點(diǎn)未來的擁擠度分級—在接下來的若干天時間里,它究竟是暢通、擁擠,還是一般擁擠?找出最優(yōu)化的結(jié)果根據(jù)不同企業(yè)的業(yè)務(wù)性質(zhì),大數(shù)據(jù)工程師可以通過數(shù)據(jù)分析來達(dá)到不同的目的。以騰訊來說,鄭立峰認(rèn)為能反映大數(shù)據(jù)工程師工作的最簡單直接的例子就是選項(xiàng)測試(AB Test),即幫助產(chǎn)品經(jīng)理在A、B兩個備選方案中做出選擇。在過去,決策者只能依據(jù)經(jīng)驗(yàn)進(jìn)行判斷,但如今大數(shù)據(jù)工程師可以通過大范圍地實(shí)時測試—比如,在社交網(wǎng)絡(luò)產(chǎn)品的例子中,讓一半用戶看到A界面,另一半使用B界面,觀察統(tǒng)計一段時間內(nèi)的點(diǎn)擊率和轉(zhuǎn)化率,以此幫助市場部做出最終選擇。作為電商的阿里巴巴,則希望通過大數(shù)據(jù)鎖定精準(zhǔn)的人群,幫助賣家做更好的營銷?!拔覀兏诖氖悄隳苷业竭@樣一批人,比起現(xiàn)有的用戶,這些人對產(chǎn)品更感興趣?!毖F榮說。一個淘寶的實(shí)例是,某人參賣家原來推廣的目標(biāo)人群是產(chǎn)婦,但工程師通過挖掘數(shù)據(jù)之間的關(guān)聯(lián)性后發(fā)現(xiàn),針對孕婦群體投放的營銷轉(zhuǎn)化率更高。B 需要具備的能力數(shù)學(xué)及統(tǒng)計學(xué)相關(guān)的背景就我們采訪過的BAT三家互聯(lián)網(wǎng)大公司來說,對于大數(shù)據(jù)工程師的要求都是希望是統(tǒng)計學(xué)和數(shù)學(xué)背景的碩士或博士學(xué)歷。沈志勇認(rèn)為,缺乏理論背景的數(shù)據(jù)工作者,更容易進(jìn)入一個技能上的危險區(qū)域(Danger Zone)—一堆數(shù)字,按照不同的數(shù)據(jù)模型和算法總能捯飭出一些結(jié)果來,但如果你不知道那代表什么,就并不是真正有意義的結(jié)果,并且那樣的結(jié)果還容易誤導(dǎo)你?!爸挥芯邆湟欢ǖ睦碚撝R,才能理解模型、復(fù)用模型甚至創(chuàng)新模型,來解決實(shí)際問題?!鄙蛑居抡f。計算機(jī)編碼能力實(shí)際開發(fā)能力和大規(guī)模的數(shù)據(jù)處理能力是作為大數(shù)據(jù)工程師的一些必備要素。“因?yàn)樵S多數(shù)據(jù)的價值來自于挖掘的過程,你必須親自動手才能發(fā)現(xiàn)金子的價值?!编嵙⒎逭f。舉例來說,現(xiàn)在人們在社交網(wǎng)絡(luò)上所產(chǎn)生的許多記錄都是非結(jié)構(gòu)化的數(shù)據(jù),如何從這些毫無頭緒的文字、語音、圖像甚至視頻中攫取有意義的信息就需要大數(shù)據(jù)工程師親自挖掘。即使在某些團(tuán)隊(duì)中,大數(shù)據(jù)工程師的職責(zé)以商業(yè)分析為主,但也要熟悉計算機(jī)處理大數(shù)據(jù)的方式。對特定應(yīng)用領(lǐng)域或行業(yè)的知識在顏莉萍看來,大數(shù)據(jù)工程師這個角色很重要的一點(diǎn)是,不能脫離市場,因?yàn)榇髷?shù)據(jù)只有和特定領(lǐng)域的應(yīng)用結(jié)合起來才能產(chǎn)生價值。所以,在某個或多個垂直行業(yè)的經(jīng)歷能為應(yīng)聘者積累對行業(yè)的認(rèn)知,對于之后成為大數(shù)據(jù)工程師有很大幫助,因此這也是應(yīng)聘這個崗位時較有說服力的加分項(xiàng)?!八荒苤皇嵌脭?shù)據(jù),還要有商業(yè)頭腦,不論對零售、醫(yī)藥、游戲還是旅游等行業(yè),能就其中某些領(lǐng)域有一定的理解,最好還是與公司的業(yè)務(wù)方向一致的,”就此薛貴榮還打了個比方,“過去我們說一些奢侈品店員勢利,看人一眼就知道買得起買不起,但這群人恰恰是有敏銳度的,我們認(rèn)為他們是這個行業(yè)的專家。又比如對醫(yī)療行業(yè)了解的人,他在考慮醫(yī)療保險業(yè)務(wù)時,不僅會和人們醫(yī)院看病的記錄相關(guān),也會考慮飲食數(shù)據(jù),這些都是基于對該領(lǐng)域的了解?!盋 大數(shù)據(jù)工程師的職業(yè)發(fā)展如何成為大數(shù)據(jù)工程師由于目前大數(shù)據(jù)人才匱乏,對于公司來說,很難招聘到合適的人才—既要有高學(xué)歷,同時最好還有大規(guī)模數(shù)據(jù)處理經(jīng)驗(yàn)。因此很多企業(yè)會通過內(nèi)部挖掘。今年8月,阿里巴巴舉辦了一個大數(shù)據(jù)競賽,把天貓平臺上的數(shù)據(jù)拿出來,去除敏感問題后,放到云計算平臺上交予7000多支隊(duì)伍進(jìn)行比賽,比賽分為內(nèi)部賽和外部賽。“通過這個方式來激勵內(nèi)部員工,同時也發(fā)現(xiàn)外部人才,讓各行業(yè)的大數(shù)據(jù)工程師涌現(xiàn)出來?!鳖伬蚱冀ㄗh,目前長期從事數(shù)據(jù)庫管理、挖掘、編程工作的人,包括傳統(tǒng)的量化分析師、Hadoop方面的工程師,以及任何在工作中需要通過數(shù)據(jù)來進(jìn)行判斷決策的管理者,比如某些領(lǐng)域的運(yùn)營經(jīng)理等,都可以嘗試該職位,而各個領(lǐng)域的達(dá)人只要學(xué)會運(yùn)用數(shù)據(jù),也可以成為大數(shù)據(jù)工程師。薪酬待遇作為IT類職業(yè)中的“大熊貓”,大數(shù)據(jù)工程師的收入待遇可以說達(dá)到了同類的頂級。根據(jù)顏莉萍的觀察,國內(nèi)IT、通訊、行業(yè)招聘中,有10%都是和大數(shù)據(jù)相關(guān)的,且比例還在上升。顏莉萍表示,“大數(shù)據(jù)時代的到來很突然,在國內(nèi)發(fā)展勢頭激進(jìn),而人才卻非常有限,現(xiàn)在完全是供不應(yīng)求的狀況。”在美國,大數(shù)據(jù)工程師平均每年薪酬高達(dá)萬美元,而據(jù)了解,在國內(nèi)頂尖互聯(lián)網(wǎng)類公司,同一個級別大數(shù)據(jù)工程師的薪酬可能要比其他職位高20%至30%,且頗受企業(yè)重視。職業(yè)發(fā)展路徑由于大數(shù)據(jù)人才數(shù)量較少,因此大多數(shù)公司的數(shù)據(jù)部門一般都是扁平化的層級模式,大致分為數(shù)據(jù)分析師、資深研究員、部門總監(jiān)3個級別。大公司可能按照應(yīng)用領(lǐng)域的維度來劃分不同團(tuán)隊(duì),而在小公司則需要身兼數(shù)職。有些特別強(qiáng)調(diào)大數(shù)據(jù)戰(zhàn)略的互聯(lián)網(wǎng)公司則會另設(shè)最高職位—如阿里巴巴的首席數(shù)據(jù)官。“這個職位的大部分人會往研究方向發(fā)展,成為重要數(shù)據(jù)戰(zhàn)略人才?!鳖伬蚱颊f。另一方面,大數(shù)據(jù)工程師對商業(yè)和產(chǎn)品的理解,并不亞于業(yè)務(wù)部門員工,因此也可轉(zhuǎn)向產(chǎn)品部或市場部,乃至上升為公司的高級管理層。
西西和嘻嘻
1.找出過去事件的特征大數(shù)據(jù)工程師一個很重要的工作,就是通過分析數(shù)據(jù)來找出過去事件的特征。比如,騰訊的數(shù)據(jù)團(tuán)隊(duì)正在搭建一個數(shù)據(jù)倉庫,把公司所有網(wǎng)絡(luò)平臺上數(shù)量龐大、不規(guī)整的數(shù)據(jù)信息進(jìn)行梳理,總結(jié)出可供查詢的特征,來支持公司各類業(yè)務(wù)對數(shù)據(jù)的需求,包括廣告投放、游戲開發(fā)、社交網(wǎng)絡(luò)等。找出過去事件的特征,最大的作用是可以幫助企業(yè)更好地認(rèn)識消費(fèi)者。通過分析用戶以往的行為軌跡,就能夠了解這個人,并預(yù)測他的行為。“你可以知道他是什么樣的人、他的年紀(jì)、興趣愛好,是不是互聯(lián)網(wǎng)付費(fèi)用戶、喜歡玩什么類型的游戲,平常喜歡在網(wǎng)上做什么事情?!彬v訊云計算有限公司北京研發(fā)中心總經(jīng)理鄭立峰說。下一步到了業(yè)務(wù)層面,就可以針對各類人群推薦相關(guān)服務(wù),比如手游,或是基于不同特征和需求衍生出新的業(yè)務(wù)模式,比如微信的電影票業(yè)務(wù)。2.預(yù)測未來可能發(fā)生的事情通過引入關(guān)鍵因素,大數(shù)據(jù)工程師可以預(yù)測未來的消費(fèi)趨勢。在阿里媽媽的營銷平臺上,工程師正試圖通過引入氣象數(shù)據(jù)來幫助淘寶賣家做生意?!氨热缃衲晗奶觳粺?,很可能某些產(chǎn)品就沒有去年暢銷,除了空調(diào)、電扇,背心、游泳衣等都可能會受其影響。那么我們就會建立氣象數(shù)據(jù)和銷售數(shù)據(jù)之間的關(guān)系,找到與之相關(guān)的品類,提前警示賣家周轉(zhuǎn)庫存。”薛貴榮說。在百度,沈志勇支持“百度預(yù)測”部分產(chǎn)品的模型研發(fā),試圖用大數(shù)據(jù)為更廣泛的人群服務(wù)。已經(jīng)上線的包括世界杯預(yù)測、高考預(yù)測、景點(diǎn)預(yù)測等。以百度景點(diǎn)預(yù)測為例,大數(shù)據(jù)工程師需要收集所有可能影響一段時間內(nèi)景點(diǎn)人流量的關(guān)鍵因素進(jìn)行預(yù)測,并為全國各個景點(diǎn)未來的擁擠度分級—在接下來的若干天時間里,它究竟是暢通、擁擠,還是一般擁擠?3.找出最優(yōu)化的結(jié)果根據(jù)不同企業(yè)的業(yè)務(wù)性質(zhì),大數(shù)據(jù)工程師可以通過數(shù)據(jù)分析來達(dá)到不同的目的。以騰訊來說,鄭立峰認(rèn)為能反映大數(shù)據(jù)工程師工作的最簡單直接的例子就是選項(xiàng)測試(AB Test),即幫助產(chǎn)品經(jīng)理在A、B兩個備選方案中做出選擇。在過去,決策者只能依據(jù)經(jīng)驗(yàn)進(jìn)行判斷,但如今大數(shù)據(jù)工程師可以通過大范圍地實(shí)時測試—比如,在社交網(wǎng)絡(luò)產(chǎn)品的例子中,讓一半用戶看到A界面,另一半使用B界面,觀察統(tǒng)計一段時間內(nèi)的點(diǎn)擊率和轉(zhuǎn)化率,以此幫助市場部做出最終選擇。
嗨吃嗨脹
黑馬、優(yōu)就業(yè)、千鋒都算是市面上比較好的大數(shù)據(jù)培訓(xùn)機(jī)構(gòu)其中教學(xué)質(zhì)量和教學(xué)服務(wù)三家都差不多但是教學(xué)設(shè)施和教學(xué)環(huán)境優(yōu)就業(yè)就要比其他兩家高很多了你可以去這三家都實(shí)地看一下再做決定
飄飄飛雪
首先,我們可以從數(shù)據(jù)獲取、數(shù)據(jù)存取、數(shù)據(jù)清洗、數(shù)據(jù)挖掘分析、數(shù)據(jù)可視化、數(shù)據(jù)報告等幾個方面入手。具體涵蓋以下技能:1、Linux操作系統(tǒng)、Linux常用命令、Linux常用軟件安裝、Linux網(wǎng)絡(luò)、 防火墻、Shell編程等。2、Java 開發(fā),掌握多線程、掌握并發(fā)包下的隊(duì)列、掌握J(rèn)VM技術(shù)、掌握反射和動態(tài)代理、了解JMS。3、Zookeeper分布式協(xié)調(diào)服務(wù)、Zookeeper集群的安裝部署、Zookeeper數(shù)據(jù)結(jié)構(gòu)、命令。4、Hadoop 、Hive、HBase、Scala、Spark 、Sqoop、Flume、Oozie、Hue等大數(shù)據(jù)生態(tài)系統(tǒng)知識和技能。6、Excel、Mysql、Python等數(shù)據(jù)采集,數(shù)據(jù)存取分析挖掘工具和技術(shù)。7、Tableau、FineBI、Qlikview等可視化應(yīng)用能力。關(guān)于大數(shù)據(jù)挖掘工程師應(yīng)具備哪些技能,青藤小編就和您分享到這里了。如果您對大數(shù)據(jù)工程有濃厚的興趣,希望這篇文章可以為您提供幫助。如果您還想了解更多關(guān)于數(shù)據(jù)分析師、大數(shù)據(jù)工程師的技巧及素材等內(nèi)容,可以點(diǎn)擊本站的其他文章進(jìn)行學(xué)習(xí)。
憨丶小包
全國培訓(xùn)機(jī)構(gòu)千千萬,別的不說,給幾點(diǎn)建議還是可以的:1.看師資,這個是必要的,畢竟好的老師,教學(xué)水平會直接影響在學(xué)學(xué)員的學(xué)習(xí)質(zhì)量,那么我們該如何分辨?直接有效的方式就是實(shí)地的試聽,試聽老師的課程,去感受上課的氛圍,學(xué)生的一個學(xué)習(xí)狀態(tài),大概你就清楚老師的教學(xué)水平了。2.看教學(xué)方式,授課模式,對于想通過培訓(xùn)轉(zhuǎn)行IT,建議教學(xué)模式選擇面授,教學(xué)方式選擇理論+實(shí)踐+項(xiàng)目實(shí)訓(xùn)的學(xué)習(xí)模式,因?yàn)榧夹g(shù)行業(yè),實(shí)踐為主,面授的話,老師可以手把手的帶,手把手的教,有什么問題可以隨時的問,隨時解決,提升自己的學(xué)習(xí)效率。3.看后期學(xué)員的就業(yè)情況,看口碑,市場的口碑,是否總體口碑情況較好,了解往屆畢業(yè)學(xué)員的就業(yè)情況,平均薪資,這個你可以看他們的就業(yè)數(shù)據(jù),有條件的可以跟以往學(xué)生聯(lián)系下,了解具體的一個情況,心里就有底了。道聽途說不足為信,要實(shí)地考察。個人建議,以上三個方面為重點(diǎn)考察要點(diǎn),至于課程體系,學(xué)費(fèi),都是可以直觀看到的,可以通過朋友,自己的對比來進(jìn)行考量,就不一一的闡述了。對了還有最后一點(diǎn),要明白,后期就業(yè)好不好,跟自己的技術(shù)能力有關(guān),在培訓(xùn)期間好好的學(xué)習(xí)技術(shù)是關(guān)鍵,后期也需要自己不斷的學(xué)習(xí),那么就業(yè)自然是不用擔(dān)心的。希望想入行IT的小伙伴,都能找到自己滿意的培訓(xùn)機(jī)構(gòu)。
優(yōu)質(zhì)工程師考試問答知識庫