BI方法论-数据分析

本文以W产品为例,来梳理如何通过数据分折和模型,明确用户偏好的活动内容和习惯的触达资源,确保用户在合适的时机合适的渠道看到合适的活动,从而达到帮助产品的朋友们合理渠道,提高运营活动效率的目标。

无论是互眹网产品还是传统产品、无论是PC端还是H5端。都离不开活动运营(拉营收、活跃等),但毎个月可投入的成本是有限,包含活动资源(及实物奖品),触达资源(公众号、各渠道平台、TIPS等)。

那么问题来了,业务如何让有限的资源产生最大的营运效率?对用户如何让触达的内容正好符合其需求及不撤?

本文以W产品为例,来梳理如何通过数据分折和模型,明确用户偏好的活动内容和习惯的触达资源,确保用户在合适的时机合适的渠道看到合适的活动,从而达到帮助产品的朋友们合理渠道,提高运营活动效率的目标。

1、优化活动资源

2、优化触达资源配置

根据用户对触达的敏感度,以及对各渠道/触达时间的偏好,决定要不要触达,如何触达。

3、明确用户的兴趣点

用户跟新W产品还是其他,最喜欢哪款产品?更倾向A奖励还是B奖励?

步骤

本文主要分7个步骤来实现,中间的一些产出也可输出策略:

一、问题转化:定义业务的自驱动用户

1、业务理解的自驱动用户

自我驱动,表示用户发生行为的动机来自自身需要。一个业务的自驱用户,即自发活跃或者自发付费的用户。例:京东plus会员,即自发付费。支付宝的自驱动活跃用户,自行打开APP并非因为活动打折或者活动吸引。

2、模型理解的自驱动用户

如何用数据判断自驱动用户呢?

  1.白名单机制,随机圈定一部分用户,不让运营活动触达,缺点:有的活动不需要通过邀请的方式参与,用户可能自己看到了活动。

  2.选取无运营态的固定入口,自行进入该入口付费的用户,定为自驱动用户。

二、模型训练:自驱动评分

1、样本选择

正样本:在第一部分中,我们定义了自驱动用户,那么将这部分用户作为正样本即可。

负样本:负样本选择时需要考虑具体场景,此处不展开。例:续费场景下的负样本即将到期未续费用户。

2、特征构造

3、模型选择

这里考虑到LR模型可写成以下形式,为了在分群阶段直接利用权重(a)和特征得分(x)的乘积作为分群的特征,建议选择LR模型:

也可以按自己习惯使用决策树、随机森林、XGboost等

三、实例验证

为了说自驱动评分模型对用户自驱力有足够的区分度,需要做验证。

这里介绍2种方法:

①采用已知效果非常好的活动和传统无活动的固化入口做比较,分别计算在活动和固定入口付费用户的自驱动评分。

②白名单制,将非活动开通的用户和活动开通用户的自驱动评分比较。

四、寻找影响驱动力的重要因素

证明了模型有效后,我们需要筛选出对模型影响比较大的特征,既影响驱动力的重要因素。为了消除样本抽样的随机性以及特征共线性对特征权重的影响,需要重复训练模型,得到权重稳定且绝对值高的特征。

这些特征还可以用作magic number 的寻找,为运营提供长期策略建议,如下图。

五、驱动力分级

在上一步我们得到了对模型影响比较大的特征,以及这些特征的权重,接下去就可以利用他们来对用户做分群,具体操作分为:

结果:

六、用户偏好画像

在上一步我们通过一级分群得到了用户的驱动力等级和表现显著的类别,接下去需要对每个客群,表现显著的类别进行二级分群,得到每个客群用户具体活跃的产品(即一级特征)。如果一级特征还有二级、三级产品,则需要进一步拆分特征,进行三级、四级分群,或者接入现有的推荐结果,直到得到可落地的结果。以用户兴趣偏好的分群为例,如下图:

七、整合驱动画像,投入投放平台

经过模型和分析,我们得到了用户的驱动力层级、触达敏感度、偏好的产品和触达渠道,可将这些内容整合为一个宽表,接入系统推送给业务方使用。还可以建报表,监控不同驱动层级,不同触达敏感度,不同渠道、内容偏好的用户总量,明确各产品可运营的用户盘子。

作者:陈先生

本文为「人人都是产品经理」社区和友盟+联合举办的“2019「友盟杯」数据分析大赛”中参赛作品,未经作者及平台许可,禁止转载

本文部分数据有脱敏处理,非全部真实数据

有关产品测评大赛合作事宜,请联系邮箱:denis@woshipm.com

你或许想:《去原作者写文章的地方

「点点赞赏,手留余香」

    还没有人赞赏,快来当第一个赞赏的人吧!
0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论