隋唐演义

隋唐演义

数据分析的面试题怎么做 数据分析常见业务面试题

双十一 0

手机淘宝搜:天降红包55 5月20日开始,每天领红包。
京示搜:天降红包369,5月28日开始

数据分析的面试问题,数据分析的面试的专业问题,数据分析的面试简历要计算机二级吗,数据分析面试

1.某APP近期上线了一个拉新活动,并在各个渠道进行了推广投放,活动结束后,作为数据分析师,你如何评估这场活动的效果?

①活动关键核心指标达成情况,比如拉新多少用户,达成多少GMV?ROI如何?

②活动关键流程是什么?以及各个流程的漏斗分析(留存,流失率分别是多少),可能的原因有哪些

③活动在哪些渠道推送?活动推送给哪些用户?用户画像是啥样的?各渠道用户的质量/ROI如何?

④活动玩法的裂变效果如何?利益点是否有吸引力?活动整个过程节奏把控如何,前期预热,中期爆发和尾期是否过短/过长,运营应该在何时进行适当干预

2.什么是漏斗分析?有哪些注意的点?

定义:漏斗分析通常作为一种数据分析工具,主要是衡量应用在各关键路径上的流转情况,从而直观地反映出当前产品阻碍用户继续向下使用的关键节点,从而为后续产品迭代提供数据支撑

最核心的有三点:分解流程,评估转化率和定位问题环节

常见的电商漏斗:首页 - 详情页 - 购物车 - 支付;用户的生命周期AARRR;用户行为周期AIDMA

需要注意的点:①漏斗的各个环节一定是连续的,对应连续的业务流程 ②漏斗的环节不宜过多,一般不超过5个 ③一般以上一环节为基准,计算相邻两个环节的转化率 ④计算每相邻环节的转化率,1 - 转化率即为流失率,但并不意味着转化率最低的环节就是问题环节 ⑤漏斗可以结合其他维度看,看不同维度下的漏斗差异,进而判断是哪个因素导致了问题的出现

3.你是怎么理解数据分析的,流程如何

数据分析是基于对业务的理解,发现业务中的问题或潜在增长点,形成分析思路,并利用数据分析工具进行分析,给出结论和解决方案,并协调各方推动方案落地,解决问题,回到业务中去的完整闭环

主要流程:观察现状 → 留意变化 → 多位交叉分析 → 预测趋势 → 生成策略 → 推动落地 → 复盘效果

4.你认为数据分析的价值如何体现?

数据分析不是数据统计,不能仅仅停留在输出一份数据报告

要给出结论,讲清楚数据背后的业务含义,数字的大小正负说明业务是好还是坏

明确数字背后的业务含义外,还要给出背后的原因:好的方面是否可以复用拓展,坏的方面原因是什么,应对方案是什么

要把方案推动落地到业务执行中,并且跟进执行的效果和复盘,螺旋上升,不断迭代优化

5.指标的异常波动变化(例如日活下跌)如何分析?

①首先对以下内容进行确定

确定数量来源是否可靠

确定指标的计算口径是否一致

确定是否是市场的整体趋势

②其次可以从以下角度进行分析

描述性统计:下跌了多少

观察变化:同比下跌多少,环比下跌多少

评估变化/方差分析:跌幅是否在合理范围

交叉分析/相关性分析:对指标进行拆解,有哪些指标可能和日活下跌有关系,有关系到什么程度

业务分析:这些指标的运营部分,是否有某些运营策略或者活动造成了这些指标的变化,间接导致日活下跌

回归分析/预测:还会跌几天?跌幅最坏到什么程度

风险/损失评估:日活下跌对产品的核心KPI有什么影响

制定策略:如何挽回损失/下次如何避免

6.注册类和活跃类指标,你会看哪个?

不同时期关注的指标不同,应区别对待

产品初期:关注产品的快速增长,会重点关注注册类指标

产品成熟期:关注用户的使用粘性,深度等,会重点关注留存和活跃类指标

7.估算一个某品牌门店的销售额

利用“二八原则”拆分,该门店主要以饮品为主,饮品主要以咖啡为主

①从需求端估算

CBD一共有多少人

喝咖啡的比例

每人每天喝几杯

②从供给端估算

忙时供给:忙时每小时多少杯,一天多少忙时

闲时供给:闲时每小时多少杯,一天多少闲时

8.你理解的数据指标是什么?指标口径是什么?

数据指标:有别于传统意义上的数据指标,它是通过对数据进行分析得到的一个汇总结果,是将业务单元精分和量化后的度量值,使得业务目标可描述,可度量,可拆解

数据指标需要对业务需求进行进一步抽象,通过埋点进行数据采集,设计一套计算规则,并通过BI和数据可视化呈现,最终能够解释用户行为变化及业务变化

数据指标一般与维度一起联合分析,从不同维度看同一个指标可能会有差异和业务上的发现

指标口径:举个简单的例子,很多企业会根据自身特点对“活跃用户数”有不同的定义,例如每日登录用户数(过滤掉匿名用户)即为活跃用户数;每日在线时长超过5分钟的用户数(过滤掉低质量用户)即为活跃用户数;每日访问页面超过5个的用户数(过滤掉低质量用户)即为活跃用户数

9.指标和维度的区别和联系

指标:用于定量评估业务好坏程度而建立

维度:描述指标的角度,可以理解为看问题的方面

唯独不能独立存在,一般都是搭配着指标一起分析,可以分析不同维度下的同一指标,也可以多个维度交叉,分析某一个指标,可能会有一些业务上的发现

10.你理解的指标是什么?有哪些组成部分?

指标是有业务含义的,体现业务变化的,不是瞎拍出来的。指标是复杂的,是有特定业务场景的

指标口径:指标的定义,业务定义比如活跃用户数,打开APP的用户数,指标一般与维度一起联合分析,从不同的维度看同一个指标可能会有差异和业务上的发现。同一个指标可能会被应用与不同业务,需要注意保证指标口径的统一,避免造成指标的歧义和误解

11.什么是指标体系,如何建立?

定义:一个指标不能叫体系,多个不相关的指标也不能叫体系,一个指标体系是多个相关的指标有机结合起来,具有严格的逻辑和分层体系

建立方法:①根据业务特点和生命周期选择第一关键指标或者叫北极星指标 ②贴合业务需求将第一关键指标进行逐层拆解,可以按流程拆,按时间区域拆,按公式加减乘除拆等 ③从上至下,从顶层战略或从KPI拆解 ④从下至上,叶子指标向上汇总成整体指标

12.如果要预测下个月的淘宝销量情况,你将如何进行分析?

收集数据:收集历史数据,汇总近几年每个月的销量

数据分析:观察数据分布结构

选用模型:选取合适的模型进行预测,比如,如果数据是线性增长,那么选用线性模型,如果数据表现不仅存在线性增长,还存在季节性因素,那么选用更复杂的模型,比如,时间序列相关的模型

效果评估:结合历史数据,评估模型预测的准确性。模型效果表现良好,那么可以结合模型给出下个月的淘宝销量,如果模型效果变现较差,返回第二步

13.一些商家为了提高商品的曝光量和排名,常常会进行刷单冲销量买好评,作为平台如何识别刷单呢?

流量方面:一般来说,A商品在刷单之前搜索排名会比较靠后,刷单用户在购买A商品时,只点击查看该商品,甚至存在秒拍的情况。用户下单前没有对比同个同款商品

成交方面:流量访问的转化率异常,因为刷单比例较高,故访问了该商品且转换的订单数占比会很高,在数据上的表现即为转化率异常高;商品成交量异常,刷单商品普遍在刷单之前成交量较低,故刷单之后,商品成交量可能会出现暴增

物流方面:一般来说,电商内部的物流订单号是唯一的,即不会重复,刷单商家为了节约成本,可能会重复利用同一个快递订单号;同时如若刷单,商家所发快递物品可能非真实原物,且会虚假发货,可从商品重量,件数预估物流运费,物流轨迹 + 时间等方面进行甄别

买家方面:建立黑名单库,识别刷单账号;同一个手机设备,不同账号,购买同一商品;对于同一个账号重复购买同一件商品;同一个IP网络地址,不同的手机设备,购买同一个商品

14.某业务部门在上周结束了为期一周的大促,作为业务对口分析师,需要你对活动进行一次评估,你会从哪几个方面进行分析?

不管是微商,电商还是店商,有三大关键要点,分别是人,货,场三个重要的环节

①人(用户)

活跃度:活跃的用户数

转换率:下单的用户数,转换率

成交额:成交总额,人均购买金额,人均购买件数

留存率:大促结束后的留存情况以及后续的成交情况

②货(商品)

曝光的商品数:如果存在大促商品池,那么可看曝光的商品数占比

成交的商品数:统计有成交记录的商品数,及成交商品数占比

商品丰富度:从商品的结构,种类进行分析,不同种类的商品成交曝光情况

商品供应量:分析大促的供需关系,是否存在商品库存情况

商品价格:大促期间商品价格的优惠情况

③场(大促活动)

用户大促活动参与度,,比如大促是否设置小游戏,如天猫盖楼游戏,可以分析游戏的参与度和完成度

漏斗转换,大促活动每一步的漏斗流失和转换情况,指导后续大促活动的设计优化

大促页面的活跃情况

15.GMV提升20%怎么分析?

背景确认:20%提升是指AB实验结果还是日常数据监控类,如果是AB实验,确认试验涉及的方案,如果是日常数据监控类,确认数据计算的业务场景

口径确认:确认数据计算的逻辑,20%中涉及到的指标分别是什么

数据分析:确认绝对提升是多少,比如GMV提升20%,可能绝对提升量为2k。业务场景较小,波动较大

问题分类:确认该问题属于正常波动还是异常类数据问题

16.数据不平衡处理

①定义

通常是指在二分类中,两类数据量悬殊,举个例子,化妆品购买人群中,男性有100人,女性有10000,男女比例严重失衡,称为数据不平衡

②为什么重要?

数据不平衡意味着对少数类别的信息捕捉不充分,刻画的特征缺失,进而导致机器学习算法中,趋向于将测试集预测为多数类别,得到的准确性能降低

③解决方案

A.过抽样

对少数类进行重抽样,至数量与多数类相似

在上述例子中,将男性的100个样本,进行有放回抽样,直至样本数量扩充到10000个为止

优点:简单粗暴,不损失样本量

缺点:导致严重过拟合,模型的泛化性降低

B.欠抽样

对多数类进行删减,直至数量与少数类相似

在上述例子中,对女性的样本进行筛选,从10000个样本中,随机无放回抽取100个样本

优点:简单粗暴

缺点:损失大量有效信息

C.人工合成法(SMOTE)

改良版的过抽样方法

原理:根据现有少数类样本的特征,人工创造更多的少数类样本

SMOTE算法分三步走:

计算距离:以男性的100个样本为基础,计算任意样本Xi与其他99个样本的欧氏距离,得到Xi的neighbors

确定采样倍率Y:Y根据不平衡的比例计算得到。之后,对任意Xi,选取y个neighbors,记其中任意一个neighbors为Xy

创造新样本:Xnew = Xi + rand(0,1) * |Xi - Xy|

17.某一新上线功能,预期提高留存率0.1,实际提高0.05,怎么分析?

确定不是数据异常后,就分析指标下降的原因;确定该数据指标的属性:名称,数值,单位和口径(统计方式,统计范围)

再就是明确问题的描述,指标下降,是什么时间段和什么周期比较

其次定位发生的位置,是谁的销售额变低?不同用户,不同产品,不同渠道来划分

再问题拆解,公式法或业务流程拆解,销售额 = CV * 转化率 * 客单价,CV = 各方面来源的流量(免费和付费)等

确定具体原因后,分析为什么会有这个原因,内部原因:网站改版,产品更新,广告投放;外部原因:采用PEST分析法分析

18.用户流失的分析,老用户的流失和新用户的流失有什么不同?

①用户流失分析

两层模型:细分用户,产品,渠道,看到底是哪里用户流失了,注意由于是用户流失问题,所以这里细分用户时可以细分用户处在生命周期的哪个阶段

指标拆解:用户流失数量=该群体用户数量*流失率。拆解,看是因为到了这阶段的用户数量多了,还是这个用户群体的流失率比较高

内外部分析

内部:新手上手难度大,收费不合理,产品服务出现重大问题,活动质量低,缺少留存手段,用户参与度低等

外部:市场,竞争对手,社会环境,节假日等

②新用户流失和老用户流失有什么不同?

新用户流失:可能是非目标客户,产品不满足需求,难上手,竞品影响;要考虑如何在较少数据支撑下做流失用户识别,提前防止用户流失,并如何对有效的新用户进行挽回

老用户流失:可能是达到生命周期衰退期,低端用户驱逐,满足前期用户需求,竞品影响;老用户产生的消费数据较多,容易识别流失用户,做好防止流失更重要,同时考虑用户生命周期剩余价值,是否需要挽回

19.公司进行了一次活动,需要做评估,从哪些方面着手分析?

①确定促销的目的:拉新?促销活动?还是清库存?

②根据目的确定核心指标

③效果评估:与自身在活动前和活动中比较,与预定目标比,与同期其他活动比,与往期同类活动比

④持续监控:检查活动后情况,避免透支,根据后续数据检验质量

20.深圳有多少理发店?

( 在进行费米问题估算时,需要将很难获得的数据拆分为容易获得的数据

费米问题有专门逻辑套路,一般有需求端,供给端,供需端三个方面

①需求端是从用户需求的角度出发去计算市场的大小,将指标一步步拆解,若还有未知量继续拆解

②供给端是从企业供给能力出发评估企业能够支持多达市场规模

③供需结合,是最简单的方式,分为以小见大和以大见小两个方法 )

广东1.15亿人,深圳1340万人

理发店的服务对象是人,是生活需求,可从城市人口方面预估

理发师总数 = 理发店总数 * 平均每个理发店的理发师人数

平均每个理发店的理发师人数假设为5个

每个理发师每天工作8小时,一个月工作240小时

每个人每个月剪头发一次用一小时

从而每个理发师每个月理发人数 = 240人

即每个理发店每月理发人数 = 240 * 5 = 1200 人

理发店数量 = 1340 万 / 1200 = 1.1 万家左右

21.如果新开一个店,主要关注什么指标?

(可以一边提问,一边回答的方式,梳理一下大致的业务流程,有助于了解整个业务)

新开的店,可以从业务发展的不同阶段思考

既然是新开的店,说明处于业务发展(AARRR模型)的流量获取阶段,我们现阶段的关注点应该是人流量,所以增加到店体验人数为主要目标

初创阶段:要增加到店体验人数,没有历史数据的时候,先进行用户调研,问卷调查,行业研究,竞品分析,找出目标客户的用户画像,精准推广,用户画像关注的用户属性有性别,年龄,省份,行业,是否会员等,常见的行为属性有新/老用户,是否有交易,回访频率,用户来源,会员等级;主要指标有点击率,留资率,到店率,转化率

增长阶段:积累一部分成功案例后,开始重点关注客户体验营销的全流程,推广效果跟踪,售前体验满意度调查,售中流失原因反馈,售后满意度调查。主要指标有:净推荐值,满意度,忠诚度,用户流失率

22.留存率下降如何分析?

以新用户留存率下降为例,从用户,产品,运营侧分析原因

①用户

新用户是否为薅羊毛用户,是否是目标用户

解决办法:根据用户画像判断是否为目标用户,若是,考虑采取调研的方式寻找原因

②产品

产品的新手引导是否体验较差

产品功能是否不吸引用户

解决办法
..天猫618助力金币一天可以助几次?,天猫618助力金币一天可以助几次?,618活动助手,在2023 618淘宝年中大促天猫聊天群怎么升级快里,我们一起完成助力活动和分享,加入我们,一起度过有意义的2023年 618淘宝购物狂欢节时光!