美利達(dá)達(dá)道路
數(shù)據(jù)庫基礎(chǔ)知識,數(shù)據(jù)庫挖掘原語,各種亂七八糟的模型,挖掘算法基礎(chǔ)先就這么多吧,以后還有很多數(shù)學(xué)有關(guān)的東西
威達(dá)天下
1.大數(shù)據(jù)架構(gòu)的工具與組件數(shù)據(jù)工程師更關(guān)注分析基礎(chǔ)架構(gòu),因此所需的大部分技能都是以架構(gòu)為中心的。2.深入了解SQL和其它數(shù)據(jù)庫解決方案數(shù)據(jù)工程師需要對數(shù)據(jù)庫管理系統(tǒng)有比較熟悉的了解,而且深入了解SQL非常重要。同樣其它數(shù)據(jù)庫解決方案,例如Cassandra或BigTable也須熟悉,因?yàn)椴皇敲總€(gè)數(shù)據(jù)庫都是由可識別的標(biāo)準(zhǔn)來構(gòu)建。3.數(shù)據(jù)倉庫和ETL工具數(shù)據(jù)倉庫和ETL經(jīng)驗(yàn)對于數(shù)據(jù)工程師至關(guān)重要。像Redshift或Panoply這樣的數(shù)據(jù)倉庫解決方案,以及ETL工具,比如StitchData或Segment都非常有用。另外,數(shù)據(jù)存儲和數(shù)據(jù)檢索經(jīng)驗(yàn)同樣重要,因?yàn)樘幚淼臄?shù)據(jù)量是個(gè)天文數(shù)字。4.基于Hadoop的分析(HBase,Hive,MapReduce等)對基于Apache Hadoop的分析有深刻理解是這個(gè)領(lǐng)域的一個(gè)非常必要的需求,一般情況下HBase,Hive和MapReduce的知識存儲是必需的。5.編碼說到解決方案,編碼與開發(fā)能力是一個(gè)重要的優(yōu)點(diǎn)(這也是許多職位的要求),你要熟悉Python,C/C++,Java,Perl,Golang或其它語言,這會非常有價(jià)值。6.機(jī)器學(xué)習(xí)雖然數(shù)據(jù)工程師主要關(guān)注的是數(shù)據(jù)科學(xué),但對數(shù)據(jù)處理技術(shù)的理解會加分,比如一些統(tǒng)計(jì)分析知識和基礎(chǔ)數(shù)據(jù)建模
昏昏頭了
一般數(shù)據(jù)庫工程師的主要工作包括:數(shù)據(jù)備份;數(shù)據(jù)庫日常維護(hù);數(shù)據(jù)結(jié)構(gòu)方面的設(shè)計(jì);SQL調(diào)優(yōu);解決由于數(shù)據(jù)庫操作所造成的系統(tǒng)性能問題;給開發(fā)人員開展一些數(shù)據(jù)庫方面的培訓(xùn)。那么成為一名合格的數(shù)據(jù)庫工程師需掌握哪些知識技能呢?一、數(shù)據(jù)庫應(yīng)用系統(tǒng)分析及規(guī)劃:1.軟件工程與軟件生命周期。 2.數(shù)據(jù)庫系統(tǒng)生命周期。 3.數(shù)據(jù)庫開發(fā)方法與工具。 4.數(shù)據(jù)庫應(yīng)用體系結(jié)構(gòu)。 5.數(shù)據(jù)庫應(yīng)用接口。二、數(shù)據(jù)庫設(shè)計(jì)及實(shí)現(xiàn):1.概念設(shè)計(jì)。 2.邏輯設(shè)計(jì)。 3.物理設(shè)計(jì)。 4.數(shù)據(jù)庫對象實(shí)現(xiàn)及操作。三、數(shù)據(jù)庫存儲技術(shù):1.存儲與文件結(jié)構(gòu)。 2. 索引技術(shù)。四、并發(fā)控制技術(shù):1.事務(wù)管理。 2.并發(fā)控制技術(shù)。3.死鎖處理。五、數(shù)據(jù)庫管理與維護(hù):1、數(shù)據(jù)完整性。 2、數(shù)據(jù)庫安全性。 3、數(shù)據(jù)庫可靠性。 4、監(jiān)控分析。 5、參數(shù)調(diào)整。 6、查詢優(yōu)化。 7、空間管理。六、數(shù)據(jù)庫技術(shù)的發(fā)展與新技術(shù):1、分布式數(shù)據(jù)庫。 2、對象數(shù)據(jù)庫。 3、并行數(shù)據(jù)庫。 4、數(shù)據(jù)倉庫與數(shù)據(jù)挖掘。
優(yōu)質(zhì)工程師考試問答知識庫