掃盲帖之新興專業(yè)business analytics
BA專業(yè)的出現(xiàn),完全是企業(yè)對于數(shù)據(jù)分析師用人需求所導(dǎo)致的,需求產(chǎn)生的原因,歸根結(jié)底就是:大數(shù)據(jù)。大數(shù)據(jù)概念的提出可以追述到2002年,2007年移動互聯(lián)網(wǎng)加速了企業(yè)經(jīng)營數(shù)據(jù)的大量產(chǎn)生,傳統(tǒng)的Excel,Word已經(jīng)不足以支撐企業(yè)的財務(wù),市場及運營決策。傳統(tǒng)的business analyst對于足以撐爆Excel的數(shù)據(jù)量表示無從下手,而統(tǒng)計專業(yè)的員工在分析數(shù)據(jù)實驗結(jié)果很在行,但是對于business和市場又是一竅不通。大量的數(shù)據(jù)處理需要相應(yīng)的編程軟件自動計算執(zhí)行,計算機背景的人士在編程上沒有問題,但是同樣的,對于運用數(shù)據(jù)分析的結(jié)果支持企業(yè)運營決策也是一竅不通。所以誕生了business analytics或者data science這樣的一類專業(yè),培養(yǎng)同時擁有business,統(tǒng)計和計算機能力的專業(yè)人士。
BA專業(yè)的出現(xiàn),完全是企業(yè)對于數(shù)據(jù)分析師用人需求所導(dǎo)致的,需求產(chǎn)生的原因,歸根結(jié)底就是:大數(shù)據(jù)。大數(shù)據(jù)概念的提出可以追述到2002年,2007年移動互聯(lián)網(wǎng)加速了企業(yè)經(jīng)營數(shù)據(jù)的大量產(chǎn)生,傳統(tǒng)的Excel,Word已經(jīng)不足以支撐企業(yè)的財務(wù),市場及運營決策。傳統(tǒng)的business analyst對于足以撐爆Excel的數(shù)據(jù)量表示無從下手,而統(tǒng)計專業(yè)的員工在分析數(shù)據(jù)實驗結(jié)果很在行,但是對于business和市場又是一竅不通。大量的數(shù)據(jù)處理需要相應(yīng)的編程軟件自動計算執(zhí)行,計算機背景的人士在編程上沒有問題,但是同樣的,對于運用數(shù)據(jù)分析的結(jié)果支持企業(yè)運營決策也是一竅不通。所以誕生了business analytics或者data science這樣的一類專業(yè),培養(yǎng)同時擁有business,統(tǒng)計和計算機能力的專業(yè)人士。
Business analytics的學(xué)些內(nèi)容主要有以下三點:business,統(tǒng)計,計算機
Business的學(xué)習(xí)內(nèi)容,很好理解,和目前熱門商科的學(xué)習(xí)內(nèi)容非常類似,無非就是finance,marketing,accounting相關(guān)的內(nèi)容,因為不管哪個行業(yè),數(shù)據(jù)分析的作用都是支持企業(yè)的運營和決策。
傳統(tǒng)的統(tǒng)計主要內(nèi)容就是對已知的實驗結(jié)果做顯著性檢驗。傳統(tǒng)商業(yè)招聘統(tǒng)計學(xué)專業(yè)的大多為市場調(diào)研機構(gòu),對于龐大的數(shù)據(jù)整體做抽樣統(tǒng)計,F(xiàn)代企業(yè)的數(shù)據(jù)分析主要是學(xué)習(xí)如何建立和評估多變量的統(tǒng)計模型,最典型的就是回歸分析模型;貧w分析模型是現(xiàn)代企業(yè)數(shù)據(jù)分析的主要方法,除此之外就是時間序列,相關(guān)系數(shù)。
計算機技術(shù)簡單來說就是三點:數(shù)據(jù),編程,machine learning。數(shù)據(jù)很好理解,要有獨立轉(zhuǎn)化數(shù)據(jù)的能力。比如SQL:用來存儲和查詢structured數(shù)據(jù),比如Programming:主要是用來處理unstructured數(shù)據(jù),比如Map Reduce:用以快速處理分析龐大數(shù)據(jù)。這其中,SQL和Programming是最基本的。編程技術(shù)在美國運用非常廣泛,國內(nèi)用的比較多的是SPSS,和Excel一樣拖拽數(shù)據(jù)就可以了。但是美國現(xiàn)在流行的數(shù)據(jù)分析方式是用寫代碼的方式操作,運用最多的就是R和Python。Machine learning 代替的就是前面提到的回歸分析等統(tǒng)計模型方法,簡單來說就是建模。
數(shù)據(jù)分析的作用主要就是支持商務(wù)決策(data driven decision making),以下通過超市的例子講三個數(shù)據(jù)分析的應(yīng)用
Predictive Analytics:分析數(shù)據(jù)來預(yù)測未來可能發(fā)生的事情。超市發(fā)現(xiàn)客戶過去三周內(nèi)一直在買某類減肥食品,可以預(yù)測客戶以后還要繼續(xù)購買這個產(chǎn)品,超市會選擇直接打印一張買二贈一的優(yōu)惠券。
Descriptive Analytics:分析數(shù)據(jù)找出過去事件的特征和正在發(fā)生事件的趨勢。超市的analytics team通過分析,發(fā)現(xiàn)客戶購買的減肥食品都具備某個特征,比如是low sodium、low carbs,那具有這類特點的其他相關(guān)食品,超市會選擇自動推薦給客戶。
Prescriptive Analytics:分析數(shù)據(jù)來找出最佳措施、取得最優(yōu)化的結(jié)果。情人節(jié)當(dāng)天,超市斷定避孕套需求很大,直接漲價20%;情人節(jié)后,避孕套價錢回歸正常,但是事后避孕藥漲價20%。(以上三個英文名字是采用INFORMS組織的。)
同樣是做data scientist或者analytics的工作,在不同的公司,要求的技能和工作的內(nèi)容會很不一樣。
目前招聘data scientist的主力集中在以下三類行業(yè):Information Technology、Insurance、Marketing/BI。金融行業(yè)盡管也有公司在招聘會machine learning的人,但是整體上機會不多。
IT類公司,大公司對工作劃分比較細致,有人專門編程、有人專門做分析;公司規(guī)模越小的,對data scientist的編程技術(shù)要求越高,因為要cover everything。Google前段時間招聘quantitative analyst跟marketing部門合作,這個部門據(jù)說有40多個PhD,來自各個專業(yè),負責(zé)設(shè)計各種模型和實驗來幫助Google盈利; Google每年收200萬份簡歷,HR篩選不過來,干脆也招個做machine learning的高手,運用machine learning來處理世界各地提交的簡歷;微軟Online Service Division有跟marketing更接近的Data Scientist,也有很多學(xué)統(tǒng)計或者IE出身的Applied Scientist做randomized controlled experiment;而LinkedIn、Facebook的data scientist要求Java編程技術(shù)熟練,學(xué)Computer Science出身的最適合; Amazon強大的recommendation system,會根據(jù)瀏覽記錄,推薦極其相關(guān)的東西。
Insurance行業(yè)需要的主要是Predictive Modeler,他們的總體目標(biāo)就是要基于數(shù)據(jù),預(yù)測在不同客戶身上收多少保險費能最大化收益(optimize profits),所有相關(guān)專業(yè)的它們都考慮,同時,傳統(tǒng)行業(yè)也在加強analytics(他們一般不叫data science),分析數(shù)據(jù),用數(shù)據(jù)來支持決策。這類工作,一般更接近Business Intelligence(BI)和Marketing。
-
有疑問在線咨詢老師
咨詢時間:9:00-23:00
非咨詢時間也可留言 -
400-618-8866
請撥打電話咨詢咨詢時間:9:00-23:00