数据分析中最好用的估算法 费米估算法的原理是什么( 二 )


那就需要对这个问题进行数学分析,列出公式,从而拆解 。
费米估算步骤:
明确问题分析是需求端问题还是供给端问题,或者两个角度都不是问题拆解,列公式计算对问题进行拆解时,我们提倡按照不重不漏(MECE,Mutually Exclusive Collectively Exhausted)的原则 ,将问题层层拆解成子问题,从而找到问题的根源 。
在对问题进行拆解的时候,我们需要注意两个问题 。
1)避免把未知数拆解成新的未知数,而应该使得拆解后的元素变得可解决
举个例子,在“估算杭州一家奶茶店一天卖多少杯奶茶?”中,我们从需求端出发,先是估算杭州常住人口为1000万,接着估算
每天喝奶茶的人=常住人口*渗透率
假设渗透率是1%,估出每天喝奶茶的人是10万,每人每天喝一杯 。然后估算杭州有1000家奶茶店,最终得出每家奶茶店一天卖100杯奶茶 。
问题来了,我们刚刚拆解杭州奶茶店这个元素,我们估算是1000家,其实这是个特别关键的值 。这个值直接影响到了每家奶茶店平均卖多少杯奶茶 。但杭州有多少家奶茶店这个值其实也是个未知数(并不能通过常识或者数据得知,别跟我说去百度一下) 。从一个未知数继续推出一系列未知数,这样
所以拆解后的元素不能还是未知数,如果还是未知数则需要继续拆解,使得拆解后的元素变得可解决 。
2)对拆解后的部分赋予数值时,避免改变数值真实范围
不改变数值真实范围指的是在赋予计算公式中各元素以实际意义的时候,不扩大或者缩小范围,按照数据或者经验来赋予较为准确的范围 。
前文也谈论到,比如费米在估算芝加哥每个家庭有4个人,换成我们来估算的话,我们不能拍脑袋直接估算芝加哥每个家庭有10个人 。我们的估算值应该是有实际数据或者生活经验支撑的 。
在面试的时候碰到这类估算问题,千万别直接说可以百度查找等这类回答,或者转牛角尖死磕某一数据的准确性 。
面试官通过这类题目考察的其实是面试者的分析方法和逻辑,对于问题拆解的边界考虑,答案可能并不是那么重要,这个思考过程才是面试官想要的 。
四、案例分析1. 估算杭州每年奶茶店的规模大小?4.1.1 明确问题
Q:问的是杭州每年奶茶店的规模大小,规模大小具体指的是什么?
A:规模大小指的是奶茶店的销售额大小
Q:奶茶店的销售额是指仅仅销售奶茶的收入,还是包括奶茶店里别的饮料和面包等食品?
A:奶茶店的销售额指的是所有饮品(不统计面包这类食品)
4.1.2 分析需求端问题还是供给端问题,或者两个角度都不是
这个问题问的是杭州每年奶茶店的规模,是一个地域的市场规模,这类问题一般可从需求端(消费者)切入,因为杭州常住人口是一个可知的数字 。初步判定可从需求端出发 。
4.1.3 问题拆解,列公式
杭州每年奶茶店的规模大小=杭州常住人口*渗透率*50*饮品单价*每人每周续购杯数
从需求端将未知问题拆解成元素后,我们发现:
杭州常住人口:杭州常住人口数是已知的,这属于常识,目前是1000万左右 。
渗透率:渗透率指的是有多少比例的人会选择喝奶茶,这个比例需要我们估算 。估算的时候要避免改变数值真实范围,不能估算的太离谱 。
这里主要是考察边界问题,我们在回答的时候可以说通过样本估算 。比如我随机选择100位朋友,看100位朋友中有多少人是符合条件的,从而估算出渗透率 。
这里还有一个关键问题,不同年龄段的人喝奶茶的频率是不一样的 。根据生活经验,年轻人喝奶茶次数会比中年人喝老年人高,所以我们可以通过MECE法则将杭州常住人口分为小孩、年轻人、中年人和老年人,计算公式依然没有变,最终相加各类型的规模大小即可 。


以上关于本文的内容,仅作参考!温馨提示:如遇健康、疾病相关的问题,请您及时就医或请专业人士给予相关指导!

「四川龙网」www.sichuanlong.com小编还为您精选了以下内容,希望对您有所帮助: