AA佳立航
數(shù)據(jù)庫(kù)簡(jiǎn)介(包含一些基本概念和發(fā)展史);SQL語(yǔ)句;范式理論基礎(chǔ);數(shù)據(jù)庫(kù)設(shè)計(jì)基礎(chǔ)
linyuzhu313
數(shù)據(jù)分析工程師+培訓(xùn)?結(jié)構(gòu)介紹如下:
了解數(shù)據(jù)采集的意義在于真正了解數(shù)據(jù)的原始面貌,包括數(shù)據(jù)產(chǎn)生的時(shí)間、條件、格式、內(nèi)容、長(zhǎng)度、限制條件等。這會(huì)幫助數(shù)據(jù)分析師更有針對(duì)性的控制數(shù)據(jù)生產(chǎn)和采集過(guò)程,避免由于違反數(shù)據(jù)采集規(guī)則導(dǎo)致的數(shù)據(jù)問(wèn)題;同時(shí),對(duì)數(shù)據(jù)采集邏輯的認(rèn)識(shí)增加了數(shù)據(jù)分析師對(duì)數(shù)據(jù)的理解程度,尤其是數(shù)據(jù)中的異常變化。
Omniture中的Prop變量長(zhǎng)度只有100個(gè)字符,在數(shù)據(jù)采集部署過(guò)程中就不能把含有大量中文描述的文字賦值給Prop變量(超過(guò)的字符會(huì)被截?cái)啵?/p>
在Webtrekk323之前的Pixel版本,單條信息默認(rèn)最多只能發(fā)送不超過(guò)2K的數(shù)據(jù)。當(dāng)頁(yè)面含有過(guò)多變量或變量長(zhǎng)度有超出限定的情況下,在保持?jǐn)?shù)據(jù)收集的需求下,通常的解決方案是采用多個(gè)sendinfo方法分條發(fā)送;而在325之后的Pixel版本,單條信息默認(rèn)最多可以發(fā)送7K數(shù)據(jù)量,非常方便的解決了代碼部署中單條信息過(guò)載的問(wèn)題。
當(dāng)用戶(hù)在離線狀態(tài)下使用APP時(shí),數(shù)據(jù)由于無(wú)法聯(lián)網(wǎng)而發(fā)出,導(dǎo)致正常時(shí)間內(nèi)的數(shù)據(jù)統(tǒng)計(jì)分析延遲。直到該設(shè)備下次聯(lián)網(wǎng)時(shí),數(shù)據(jù)才能被發(fā)出并歸入當(dāng)時(shí)的時(shí)間。這就產(chǎn)生了不同時(shí)間看相同歷史時(shí)間的數(shù)據(jù)時(shí)會(huì)發(fā)生數(shù)據(jù)有出入。
在數(shù)據(jù)采集階段,數(shù)據(jù)分析師需要更多的了解數(shù)據(jù)生產(chǎn)和采集過(guò)程中的異常情況,如此才能更好的追本溯源。另外,這也能很大程度上避免“垃圾數(shù)據(jù)進(jìn)導(dǎo)致垃圾數(shù)據(jù)出”的問(wèn)題。
天晴小豬豬
1.大數(shù)據(jù)架構(gòu)的工具與組件數(shù)據(jù)工程師更關(guān)注分析基礎(chǔ)架構(gòu),因此所需的大部分技能都是以架構(gòu)為中心的。2.深入了解SQL和其它數(shù)據(jù)庫(kù)解決方案數(shù)據(jù)工程師需要對(duì)數(shù)據(jù)庫(kù)管理系統(tǒng)有比較熟悉的了解,而且深入了解SQL非常重要。同樣其它數(shù)據(jù)庫(kù)解決方案,例如Cassandra或BigTable也須熟悉,因?yàn)椴皇敲總€(gè)數(shù)據(jù)庫(kù)都是由可識(shí)別的標(biāo)準(zhǔn)來(lái)構(gòu)建。3.數(shù)據(jù)倉(cāng)庫(kù)和ETL工具數(shù)據(jù)倉(cāng)庫(kù)和ETL經(jīng)驗(yàn)對(duì)于數(shù)據(jù)工程師至關(guān)重要。像Redshift或Panoply這樣的數(shù)據(jù)倉(cāng)庫(kù)解決方案,以及ETL工具,比如StitchData或Segment都非常有用。另外,數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)檢索經(jīng)驗(yàn)同樣重要,因?yàn)樘幚淼臄?shù)據(jù)量是個(gè)天文數(shù)字。4.基于Hadoop的分析(HBase,Hive,MapReduce等)對(duì)基于Apache Hadoop的分析有深刻理解是這個(gè)領(lǐng)域的一個(gè)非常必要的需求,一般情況下HBase,Hive和MapReduce的知識(shí)存儲(chǔ)是必需的。5.編碼說(shuō)到解決方案,編碼與開(kāi)發(fā)能力是一個(gè)重要的優(yōu)點(diǎn)(這也是許多職位的要求),你要熟悉Python,C/C++,Java,Perl,Golang或其它語(yǔ)言,這會(huì)非常有價(jià)值。6.機(jī)器學(xué)習(xí)雖然數(shù)據(jù)工程師主要關(guān)注的是數(shù)據(jù)科學(xué),但對(duì)數(shù)據(jù)處理技術(shù)的理解會(huì)加分,比如一些統(tǒng)計(jì)分析知識(shí)和基礎(chǔ)數(shù)據(jù)建模
優(yōu)質(zhì)工程師考試問(wèn)答知識(shí)庫(kù)