您好,欢迎来到华拓网。
搜索
您的当前位置:首页2014阿里巴巴实习笔试数据分析岗

2014阿里巴巴实习笔试数据分析岗

来源:华拓网


笔试(90min)

选择(3*10)

1 X,Y的相关系数为0,则X,Y()

A, 无线性相关 B完全不相关 C……,D……

2 有5个一样的球,分别标着1,2,3,4,5,从中取两个球,球上标号和为3或6的概率是()

3 聚类分析的方法有()

4 以下两种描述分别对应哪两种对分类算法的评价标准?

(a)抓小偷,描述抓的人中有多少个是小偷的标准。

(b)描述有多少比例的小偷给抓了的标准。

A. Precision, Recall B. Recall, Precision

C. Precision, ROC D. Recall, ROC

5 小松鼠有100个松果,堆成一堆,松果堆离松鼠家有100m,松鼠每次最多只能搬50个松果,但是小松鼠是个吃货,每走两米就要吃一个松果,那么松鼠最多可以带多少松果回家

6 关于HIVE,不正确的是(内容在百度百科之内)

7 记不得了,应该是很简单的一道

8 关于逻辑回归,不正确的是(有是当前业界比较常用的机器学习方法,用于估计某种事物的可能性;回归的结果并非数学定义中的概率值,不可以直接当做概率值来用;逻辑分布公式;Y是否连续)

9 若A,B不相容,且P(A)>0,P(B)>0,说法正确的是()

10 对于正态分布,若置信度减小,则置信区间上下限的距离(小还是大,不变,不确定)

问答(10*3)

11 已知10万人中有一人患艾滋病。现有某种药物,如果某人患病,药物检出的概

率是100%;如果某人不患病,该药物检测错误认为此人患病的概率是1%。假设有人用该药物检测结果呈阳性,求此人患病的概率。

(bayes,结果0.01%)

12 现有表T1,T2 相应的栏如下:

T1: user_id, age, city

T2: user_id, date( yyyymmdd格式),GMV

其中两个表中的user_id为主键,要求把t1 t2表格合并 成t3,并满足下列条件:

1) 包含栏 user_id, age, city, GMV_1312

2) 用户年龄大于16,城市位于“广州”“深圳”,对2013年12月的GMV求和

(CREAT T3

SELECTD t1.user_id user_id, t1.age age, t1.city city, SUM(t2.CMV) GMV_1312

FROM t1,t2

WHERE ……)

13 什么是层次分析法(AHP)?基本步骤是?举场景或案例说明如何使用。

(百度即得)

分析(20*2)

14 万能淘宝有些小众但有品位的店铺,欲将这些店铺推广。请你给出办法将这些店筛选出来。

15 双十一店家发布优惠券,请你从店家和平台两个角度进行分析,要求:

1) 给出评价指标

2) 针对不同数据给出行动方案

说明:1)优惠券指满200-50,满300-100这种

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- huatuo3.cn 版权所有 湘ICP备2023017654号-3

违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务