笔试(90min)
选择(3*10)
1 X,Y的相关系数为0,则X,Y()
A, 无线性相关 B完全不相关 C……,D……
2 有5个一样的球,分别标着1,2,3,4,5,从中取两个球,球上标号和为3或6的概率是()
3 聚类分析的方法有()
4 以下两种描述分别对应哪两种对分类算法的评价标准?
(a)抓小偷,描述抓的人中有多少个是小偷的标准。
(b)描述有多少比例的小偷给抓了的标准。
A. Precision, Recall B. Recall, Precision
C. Precision, ROC D. Recall, ROC
5 小松鼠有100个松果,堆成一堆,松果堆离松鼠家有100m,松鼠每次最多只能搬50个松果,但是小松鼠是个吃货,每走两米就要吃一个松果,那么松鼠最多可以带多少松果回家
6 关于HIVE,不正确的是(内容在百度百科之内)
7 记不得了,应该是很简单的一道
8 关于逻辑回归,不正确的是(有是当前业界比较常用的机器学习方法,用于估计某种事物的可能性;回归的结果并非数学定义中的概率值,不可以直接当做概率值来用;逻辑分布公式;Y是否连续)
9 若A,B不相容,且P(A)>0,P(B)>0,说法正确的是()
10 对于正态分布,若置信度减小,则置信区间上下限的距离(小还是大,不变,不确定)
问答(10*3)
11 已知10万人中有一人患艾滋病。现有某种药物,如果某人患病,药物检出的概
率是100%;如果某人不患病,该药物检测错误认为此人患病的概率是1%。假设有人用该药物检测结果呈阳性,求此人患病的概率。
(bayes,结果0.01%)
12 现有表T1,T2 相应的栏如下:
T1: user_id, age, city
T2: user_id, date( yyyymmdd格式),GMV
其中两个表中的user_id为主键,要求把t1 t2表格合并 成t3,并满足下列条件:
1) 包含栏 user_id, age, city, GMV_1312
2) 用户年龄大于16,城市位于“广州”“深圳”,对2013年12月的GMV求和
(CREAT T3
SELECTD t1.user_id user_id, t1.age age, t1.city city, SUM(t2.CMV) GMV_1312
FROM t1,t2
WHERE ……)
13 什么是层次分析法(AHP)?基本步骤是?举场景或案例说明如何使用。
(百度即得)
分析(20*2)
14 万能淘宝有些小众但有品位的店铺,欲将这些店铺推广。请你给出办法将这些店筛选出来。
15 双十一店家发布优惠券,请你从店家和平台两个角度进行分析,要求:
1) 给出评价指标
2) 针对不同数据给出行动方案
说明:1)优惠券指满200-50,满300-100这种
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo3.cn 版权所有 湘ICP备2023017654号-3
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务