快到腕里來
數(shù)據(jù)挖掘領(lǐng)域是一個獨特的行業(yè),通常的招聘面試方法可能不大適用于本行業(yè)的特點。在招聘一個合格的數(shù)據(jù)挖掘工程師時,公司一般關(guān)注以下三個方面:他聰明嗎?聰明意味著能透過復(fù)雜的信息建構(gòu)問題并以正確的方式加以解決。聰明人還能從失敗中獲取經(jīng)驗。他能否專注于項目?專注意味著在各種困難的環(huán)境內(nèi),仍能獨立或合作完成項目。他是否能與團(tuán)隊一起工作。團(tuán)隊合作需要很好的溝通能力,工作中涉及到的概念、問題、模型、結(jié)論等都需要成員之間正確的溝通方能加以明確。為了解候選人是否具有數(shù)據(jù)挖掘工程師的潛質(zhì),需要一小時的面試,主要通過以下五個環(huán)節(jié):1、簡介如同交談之初的寒暄一樣,簡介是使候選人放松下來??梢韵冉榻B一下公司本身的情況,再回答對方的一些疑問。如果問題很復(fù)雜,可以將回答放到面試的最后階段再處理。2、關(guān)于數(shù)據(jù)挖掘項目這是最為重要且耗時的面試階段,詢問候選人最近接手的數(shù)據(jù)挖掘項目的情況和處理方式。要提問的方面包括:他一開始是如何描述這個項目的項目持續(xù)了多長時間這個項目的關(guān)鍵問題是什么問題是如何得到解決的在數(shù)據(jù)挖掘項目中最為困難的階段是什么最有趣的階段又是什么在他眼里,客戶是怎么樣的團(tuán)隊的其他成員又是如何表現(xiàn)的從中獲得了什么樣的經(jīng)驗在這個面試階段,不僅要提問關(guān)于“what”的問題,還要很多關(guān)于“why”的問題。因為優(yōu)秀的數(shù)據(jù)挖掘工程師要能面對客戶,清晰的論證并支持其提出的觀點。3、關(guān)于數(shù)據(jù)挖掘的流程考察候選人對于工作流程的認(rèn)識是必要的,如果他談到了跨行業(yè)數(shù)據(jù)挖掘流程規(guī)范(CRISP-DM)意味著好兆頭。有很多時候,候選人對這些規(guī)范不以為然。雖然說從不同的角度來看待問題是一種創(chuàng)新,但是創(chuàng)新也需要建立在堅實在流程標(biāo)準(zhǔn)之上。因為它可以保證我們不會出現(xiàn)大的紕漏。必要的時候,可以用白板讓候選人畫出流程圖。并讓他評價這些工作中最為重要或需要反思的地方。因為建模工作不可能一次完成,反復(fù)的提煉問題、建立模型的情況是經(jīng)常遇到的。另外可以在某個挖掘流程進(jìn)行深入考查,例如詢問對方如何避免過度擬合,如何從大量的候選變量中進(jìn)行篩選,如何評價或比較模型的效果。4、解決問題軟件公司的面試一般會包括“編碼測試”,考查數(shù)據(jù)挖掘工程師也應(yīng)該如此。一種可以參考的作法是提供一份存在缺陷的分析報告。讓候選人對報告進(jìn)行研究,表達(dá)報告中結(jié)論的意義,提出其中所存在的問題或不足,提出改進(jìn)或補救的方法。5、收尾在面試的最后階段,需要回答候選人的其它提問,并使之相信本公司在本行業(yè)中的優(yōu)勢地位,以及在職業(yè)生涯中的作用。在完成面試后,需要立即將面試記錄進(jìn)行整理存檔。面試是一件苦差事,但也是一個交流學(xué)習(xí)的機會。通過面試可以了解到其它人遇到的問題,以及他們是如何解決的。
吃撐了別跑
目前來看,從事數(shù)據(jù)挖掘工作,需要有較強的數(shù)學(xué)和統(tǒng)計學(xué)功底。在計算機技能方面,需要熟練使用IBM IM/SPSS Clementine/SAS EM等工具,熟悉Unix操作系統(tǒng),熟悉DB2/Oracle等大型關(guān)系數(shù)據(jù)庫,具備Shell/Perl/TCL/C/C++等編程能力,可以進(jìn)行自編挖掘算法、進(jìn)行商業(yè)統(tǒng)計分析、預(yù)測。還要掌握基本的Microsoft Office軟件,包括Excel和PowerPoint中的統(tǒng)計圖形技術(shù)。此外,能夠主動和項目中其他成員緊密合作,因為數(shù)據(jù)挖掘涉及方方面面的關(guān)系,很重視公司內(nèi)部的合作。還有一個比較重要的就是良好的客戶溝通能力??梢悦鞔_闡述數(shù)據(jù)挖掘項目的重點和難點,調(diào)整客戶對數(shù)據(jù)挖掘的誤解和過高期望,讓模型維護(hù)人員了解并掌握數(shù)據(jù)挖掘方法論及建模實施能力,這一點是工程師往后發(fā)展的一個很關(guān)鍵的點。想要提升數(shù)據(jù)挖掘工程師的能力,推薦CDA數(shù)據(jù)分析師的課程,它安排了Sklearn/LightGBM、Tensorflow/PyTorch、Transformer等工具的應(yīng)用實現(xiàn),并根據(jù)輸出的結(jié)果分析業(yè)務(wù)需求,為進(jìn)行合理、有效的策略優(yōu)化提供數(shù)據(jù)支撐。課程培養(yǎng)學(xué)員硬性的數(shù)據(jù)挖掘理論與Python數(shù)據(jù)挖掘算法技能的同時,還兼顧培養(yǎng)學(xué)員軟性數(shù)據(jù)治理思維、商業(yè)策略優(yōu)化思維、挖掘經(jīng)營思維、算法思維、預(yù)測分析思維,全方位提升學(xué)員的數(shù)據(jù)洞察力。點擊預(yù)約免費試聽課。
2014兔兔
數(shù)據(jù)挖掘工程師可以通過學(xué)習(xí)考取兩個證書,證書目前主流有兩個,一個是CDA,另一個是CPDA。全名是數(shù)據(jù)分析師,主要是數(shù)據(jù)分析方法、技術(shù)和軟件操作為主。它包括:1、統(tǒng)計概率基礎(chǔ);2、數(shù)據(jù)分析模型方法;3、軟件、工具的運用。如果這些技術(shù)不會,也不可能會操作數(shù)據(jù)分析。所以,CDA主要是針對數(shù)據(jù)分析師必不可少的技術(shù)性培訓(xùn),是數(shù)據(jù)的獲取、儲存、整理、清洗、分析,檢驗到結(jié)果報告一個整體的過程,以及數(shù)據(jù)分析部分軟件的操作。全名叫項目數(shù)據(jù)分析師,國內(nèi)出現(xiàn)最早的數(shù)據(jù)分析培訓(xùn),原先是信息產(chǎn)業(yè)部在組織,目前由中商聯(lián)數(shù)據(jù)分析專業(yè)委員會和工信部教育與考試中心主管,內(nèi)容主要針對的是基于企業(yè)在投資、經(jīng)營、管理領(lǐng)域的數(shù)據(jù)分析,類似于MBA課程。課程包括《數(shù)據(jù)分析基礎(chǔ)》、《戰(zhàn)略管理》、《量化投資》、《量化經(jīng)營》等,覆蓋企業(yè)運營的每個環(huán)節(jié),以數(shù)據(jù)分析的方法來進(jìn)行的管理、經(jīng)營、投資的分析,應(yīng)該說企業(yè)的管理層適合學(xué)習(xí)CPDA來進(jìn)行管理層面的分析和指導(dǎo)。關(guān)于數(shù)據(jù)挖掘工程師的課程推薦CDA數(shù)據(jù)分析師的相關(guān)課程,課程內(nèi)容兼顧培養(yǎng)解決數(shù)據(jù)挖掘流程問題的橫向能力以及解決數(shù)據(jù)挖掘算法問題的縱向能力。要求學(xué)生具備從數(shù)據(jù)治理根源出發(fā)的思維,通過數(shù)字化工作方法來探查業(yè)務(wù)問題,通過近因分析、宏觀根因分析等手段,再選擇業(yè)務(wù)流程優(yōu)化工具還是算法工具,而非“遇到問題調(diào)算法包”點擊預(yù)約免費試聽課。
荷葉圓圓1980
專業(yè)的數(shù)理知識熟練的數(shù)據(jù)庫技術(shù)熟練的分析工具軟件技能熟悉理解業(yè)務(wù)知識PPT寫作技術(shù)報告講解技能能算能分析能寫能講
優(yōu)質(zhì)工程師考試問答知識庫