数据分析实战,电商数据分析
随着国家开放二孩政策,婴儿市场规模也在不断的扩大,根据淘宝天猫的婴儿用品购买情况,对产品进行多维度的分析,着重分析市场需求,定位市场方向,从而在满足市场需求的同时,提高销量。
1.理解数据
数据来源于阿里天池:https://tianchi.aliyun.com/dataset/dataDetail?dataId=45
包含两张表:商品表和婴儿表
购买商品表字段信息:用户ID 商品ID 商品二级分类 商品一级分类 商品属性 购买数量 购买日期
婴儿信息表字段信息:用户ID 出生日期 性别
2.提出问题
相关指标
提出问题
1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?
2.哪些商品最热销,可主推?
3.用户年龄段、性别对于销量的影响?如何做到精准营销?
分析思路
3.数据清洗
选择子集
考虑到属性字段,都是一些编号,没办法具体分析,因此去除该字段
列重命名 把英文改成中文
一致化处理
两张表都需要对日期进行处理,转换成标准的日期格式,text函数进行格式化统一,也可以用分列进行
数据整合
使用sql 语句,制作 baby——product 和 product_baby表格
异常值处理
关于婴儿性别,0代表女,1代表男,2代表未知,要对2的异常数据进行处理,这里按照男女比例大概处理,男女比例为438:489.总共26个异常值,因此把12个替换成1,14个替换成0
4 数据分析
1.在2012年7月-2014年12月,为什么销量呈现上涨趋势?
- 首先,对销量进行多维度拆解,分成新用户购买量 和老用户购买量,分别进行分析,但是经过计算,该测试数据,老用户复购率特别低,因此可以忽略,直接从新用户购买数量,在时间维度上进行分析。
下图是商品的总体走势
接下来我们看看每年的每个月的走势对比
通过走势分析发现,在每年的5月,9月,11月都有不同程度的高峰凸起,整体呈现上涨趋势,接下来分析为什么销量上涨
2,这里可以采用4P营销理论,利用假设检验法,分别从产品、价格、渠道、宣传,四个方面进行分析
产品维度
假设:新增产品类带来销量的上升
收集证据:下面是各年各月的二级分类商品数量对比
可以看出,2014年在5月,11月商品数目有所增加,2013年和2012年有所缓慢的上升趋势,但是由于这个是订单数据,这些商品也只是获取的购买到的商品数量
所以不太准确,建议可以根据公司实际市场部的商品数据进行二次验证,因此假设检验表不成立。
价格维度
假设:降价带来的销量上涨
收集证据:
由于案例中没有涉及到价格相关数据,因此假定平均价格保持稳定,对销量影响不大,因此假设不成立。
渠道维度
假设:新增渠道带来销量上涨
收集数据:
根据每个月的走势图,我们发现,仅仅是在5,9,11存在波峰,之后前后月份都会 有所下降,所以如果是渠道增加,应该是一个持续上涨的趋势,所以推断假设不成立,案例中没有相关数据,实际工作中,可获取渠道数据进行验证,
所以在本案中,假设不成立。
宣传维度
宣传维度主要包括品牌宣传,公关,促销等,这里只分析促销
假设:由于促销活动带来销量上涨
收集证据:
先看5月数据
从图中可以看出2014年在5月3日,5月12日,5月22日都有明显的波动,特别是在5月22日,核证后,5月1日-5月3日(劳动节)、5月11日(母亲节)一节5月20日(表白节)
淘宝天猫均做促销,13年5月数据在5月3号,5月10号和5月20号也都有所上涨,说明受到节日促销的可能性很大。
接下来再看9月数据
2014年9月20日达到一个很大的波峰,2012年和2013年也有不同程度的波峰,考虑到每年的9月都会有中秋的节日,可能会不定期搞促销活动,但是
9月20日并没有什么节假日或者活动日,经核查,有一笔订单,一次性订购了2748件,属于偶然事件,不作为分析范围。
再来看11月数据
这个就很明显啦,双十一活动带来的影响,只是时间是在11月13日,不是11月11日。这个需要跟相关部门沟通一下,是不是促销时间调整的问题。
2012年在11月10日和11月19日出现高峰,2013年11月11日和11月29 日出现高峰,2014年是11月13日出现高峰,很明显是双十一带来的影响。
因此促销活动带动销量的假设成立。
总结: 促销销量增长的原因,一是促销活动带来非常好的效果,而是商品数量的增加也在一定程度上促进了销量增长,但是对于产品促销,在实际工作中,还需要进一步考虑
成本问题,对于ROI的把控,一味的促销是不可取的。
2.如何进行有效的促销?
可以从以下两个方面
主推热销产品
热销产品,这边定义为下单次数多的商品,如果从订单量考虑的话,会出现一次性购买很多的现象,下单次数多,代表大家对该产品都喜爱,这才是热销。
从图中可以看出,68结尾的商品,订单量是最大的,但是销量低于28产品,按照我们对于热销产品的定义,50008168为热销产品,这是商品一级分类,接下来分析该
商品类下的二级分类订单量情况。
接下来我们再看看该商品类在时间轴上的订单变化趋势
可以看出50013636类的商品 订单量最高,而且从时间上看,在几次的促销活动中,他都有出色的表现,说明该商品类是热销产品,那就可以考虑,对该产品
进行重点评估,下次的促销活动能够选择该商品类下的部分商品。
针对不同用户群体,精准营销
不同年龄
这边计算的是购买商品时婴儿的年龄,根据购买时间-出生时间,但是中间会存在负值的现象,是因为有一些用品是在宝宝出生前提前购买好的,这里的年龄是四舍五入取整的。
0岁代表了一部分即将出生的婴儿和刚出生不久的婴儿,另外婴儿用品,一般作为家长的喜欢屯,所以这个只是估算婴儿的年龄来分析、
可以看出,婴儿用品大部分集中在0岁到1岁之间,这里1代表的是半岁到1岁半之间的,0代表的是出生前后半岁的,那说明婴儿在出生前到1岁半之间购买量是最大的,并且对于15结尾的产品在0和1之间需求量很大,28和68产品有生前预购。
接下来看看不同性别对于销量的影响
可以看出,女婴在1岁左右对于15结尾类商品需求量比较大,男婴在0-2岁对于68结尾的商品比较大,并且在0-1岁对各类商品的需求都不少。
- 不同性别
可见女婴的购买力明显高于男生,因为2015年只有两个月的数据,所以不参与对比,从整体上销量随着时间的变化呈现上升趋势,说明母婴市场发展良好。
男婴和女婴对于商品类的偏好
可以看出女婴对于15结尾类的商品购买量比较突出,男婴对于68结尾类的商品购买量相对较高,针对女婴,可以考虑对15结尾类商品的大力推广,68结尾类商品需求男女都有,说明是刚需,可以考虑通过更多的数据去分析相关性,搭配套餐带动其他产品的促销活动。
结论与建议:
1.促销活动一定要有针对性,50013636类商品是热销商品,评估后,可以采取相应的促销手段。
2.精准营销,针对需求的多少去针对性推送广告以此来减免广告费用,提高广告效率,对于女婴产品可以集中在1岁进行15结尾类的商品进行推广,男婴产品可以在0-2岁集中推广。
3.推广渠道按照年龄划分,如果需求量在0-1岁比较大,线上推广可以结合母婴类APP在不同模块和功能点处进行针对性推广。
4.对于28的商品类和68结尾的商品类销量最大,可以进行大力的宣传和推广,在保证产品质量的同时提高产品的销量。
这只是简单 思路 ,大家可以 根据自己的想法,利用之前的分析方法进行不同角度的分析练习