2015年阿里校招數(shù)據(jù)分析師筆試題
2015年8月19日,阿里校招數(shù)據(jù)分析師筆試題。共計21題(單選漏了一題,選擇題每個人的都不一樣,問答題是一樣的。暫時沒有答案,希望對大家有用。
單選題:
1、觀測宇宙中單位體積內(nèi)星球的個數(shù),屬于什么分布:
A學生分布B泊松分布C正態(tài)分布D二項分布
2、一些關(guān)于數(shù)據(jù)挖掘說法是正確的
A數(shù)據(jù)挖掘是萬能的
B如果你建立了一個database,那就意味著你已經(jīng)有足夠的數(shù)據(jù)可以做數(shù)據(jù)挖掘了
C數(shù)據(jù)挖掘=數(shù)據(jù)+算法,數(shù)據(jù)挖掘人員大部分的時間用來處理復雜的挖掘算法
DABC均有錯
3、已知隨機變量X,Y分別服從泊松分布P(S),卡方分布X2(t),E(X)=4,D(Y)=9,則參數(shù)s,t分別:
A2,9;B4,9C4,4.5;D2,4.5
4 、下面算法中哪一種不屬于廣義線性回歸算法
A生存模型算法
Bbeta回歸算法
Clogit回歸算法
D判別分析算法
5、有一列1000萬淘寶買家的淘寶運費險保費數(shù)據(jù),要計算該列數(shù)據(jù)的P1-P100分位數(shù),可使用哪個SAS語句?
Aproc sort
Bproc rank
Cproc univariate
Dproc freq
6、X服從區(qū)間(2,6)上的均勻分布,求對X進行3次獨立觀測中,至少有2次的觀測值大于3的概率。
A0.84375
B0.75275
C0.65275
D0.80370
7、下面對于“預測變量間可能存在較嚴重的多重共線性”的.論述中錯誤的是?
A回歸系數(shù)的符號與專家經(jīng)驗知識不符
B方差膨脹因子(VIF)<5
C其中兩個預測變量的相關(guān)系數(shù)>=0.85
D變量重要性與專家經(jīng)驗嚴重違背
8、由于淘寶買家消費數(shù)據(jù)是億級別,假設為了快速計算買家每月的平均消費額,采用抽樣1W個買家來計算
A采用分層抽樣方法把全量淘寶買家按照星級,每層抽取相同的數(shù)量,計算平均值
B采用系統(tǒng)抽樣方法,把全量買家隨機排序,每隔一定數(shù)量抽一個,計算平均值
C采用無放回隨機方法,從全量買家中隨機挑選一個買家,不放回,如此循環(huán)
D采用有放回隨機方法,從全量買家中隨機挑選一個買家,然后再放回,如此循環(huán)
9、請找出數(shù)列4,9,23,60,157的下一項()
A 411 B 314 C 425 D ABC均錯
10(應該是沒統(tǒng)計上)
多選題
11、以下哪個語法不是R的基礎(chǔ)語言
Aproc glot
Bselect *from table
Ckc<-kmeans(data,3)
Dprint”hello world”
Esd<-summary(data)
Fimport
12、分析師在工作中的良好習慣是
A將工作空間的密碼共享給別人
B將數(shù)據(jù)下載到私人電腦進行分析處理
C在處理資源高峰期提交大任務運算
D不定期地將分析報告分享給團隊
E定期清理存儲空間
F固話日常需要分析的數(shù)據(jù)表方便計算
13
14
15
16 、 請分析淘寶消費者的流失情況
17 、 淘寶和天貓上每天都有大量的用戶在線上購買,作為分析師可以從哪些角度對用戶進行分析,說明理由
18
19
20已知A商家近五年每月的成交數(shù)據(jù),請列出兩種不同的時間序列預測模型可以用來預測商家接下來三個月的成交,并詳細闡述在使用每一種方法前需要對數(shù)據(jù)進行什么預處理以及具體方法
21你理解中的分析師是什么樣的?你覺得自己目前應聘分析師職位的優(yōu)勢是什么?并說明理由。
【2015年阿里校招數(shù)據(jù)分析師筆試題】相關(guān)文章:
阿里巴巴校招數(shù)據(jù)分析師職位筆試題目08-21
2015阿里校招數(shù)據(jù)產(chǎn)品經(jīng)理筆試題08-13
阿里巴巴2016校招筆試題09-14
2015阿里校招運營專員筆試題08-21
阿里校招視覺設計師筆試題09-11
2015阿里校招研發(fā)工程師筆試題08-13
阿里巴巴綜合筆題11-13
阿里在線前端筆試題01-15