BDA数据分析师实践考核,数据分析员是做什么的

做什么 4
BDA数据分析师实践考核 (适用初、中级实践考核报告) 报告名称:基于黑五销售数据的用户画像与营销策略分析 考核级别: 初级商业分析师 。
作者: 周子歆 。
单位: 西南财经大学 。
联系方式: 。
提交时间: 2021年9月 。
目录 目录 文献综述............................................................5数据采集及数据预处理................................................6 2.1数据来源.........................................................62.2数据清洗.........................................................6描述性分析..........................................................73.1因变量:销售额描述性统计........................................73.2性别分布分析.....................................................73.3年龄分布分析.....................................................83.4婚姻状态分析.....................................................93.5城市分布分析.....................................................93.6职业分析........................................................103.7产品种类分析....................................................113.7用户画像总结....................................................11诊断性分析.........................................................124.1相关性分析......................................................124.2产品种类累积分析................................................124.3复合指标分析....................................................13结论...............................................................14建议...............................................................15参考文献...........................................................16 基于黑五销售数据的用户画像与营销策略分析 摘要为了解“黑色星期五”购物节的销售规律,本文以某店黑色星期五的大促活动相关销售数据与用户信息为样本,选取性别、年龄、城市、职业、销售额等数据,运用Excel等软件进行描述性分析与进一步的对比分析、分组分析寻找用户的基础画像为以26-35岁单身男性为主的群体,主要在B类型城市居住1年以内等,整体黑五购物节深受单身经济影响。
对此,本文在从平台营销、产品迭代、物流服务等方面提出建议。
关键词黑五销量用户画像描述性分析分组分析 引言 电商平台与物流产业的兴起造就了一批线上线下全民购物节。
作为欧美国家中热度媲美国内“双十一”的购物节,“黑色星期五”以其大规模的促销优惠吸引人们的疯狂抢购,从而给商家带来丰厚的销售与利润。
“黑五”的销量在后疫情时代出现了报复性猛增,但人们的实际消费能力却有所降低,因此未来黑五销量是否能够保持增长趋势仍无法确定。
本文基于某店黑五销售数据,通过数据分析寻找用户的特征,了解核心用户画像,为后续营销策略给与建议支持。
文献综述 美国感恩节后的第一个星期五被称为“黑色星期五”,是美国传统的促销节。
受疫情影响,往年美国人在“黑五”期间疯狂抢购的场景今年没有出现。
据统计,2020年美国实体零售店到店客流量同比降幅达48%。
然而当天美国在线消费额同比激增21.6%,达90亿美元,创历史最高水平。
消费者平均每分钟在线消费630万美元,平均每人花费27.50美元。
手机购物销售额同比增长25.3%,达到36亿美元,占网络总消费能力的40%。
疫情促使总体消费习惯出现较大的改变。
国内,“唯品会”、“京东”、“拼多多”等电商平台投身“黑五”战局,黑五”海淘大战电商形成“四大门派”:拼多多+亚马逊、天猫国际+考拉海购、京东国际+唯品国际及洋码头+分期乐。
“海外购”板块业务持续推进,黑五产品源源不断进口内销。
由于“秋转冬”,内需扩大,疫情刺激等因素,“黑五”对国内外都是经济恢复的机遇。
因此后疫情时代如何更好的促进“黑五”购物节的发展成为消费领域值得关注的问题。
本文基于某门店往年“黑五”销售数据的分析获取核心用户画像,以案例分析的方式提出进一步激励销售的建议,为“黑五”购物节销售中类似商家提供参考思路。
但由于实际样本的局限,本文结果并不能代表整体黑五市场,后续可以通过不同层次商家的销售数据进一步分析归纳出更为典型的用户画像,提出更精准的建议。
数据采集及数据预处理 2.1数据来源 本文数据来源为黑色星期五的大促活动。
文章以一家零售商店在黑色星期
期间的部分销售数据为数据集样本,共有537577条数据,12个字段,包括用户 ID,商品ID性别、年龄、城市、职业、在当地城市居住年限、婚姻状况、商品 类别、销售额等。
数据处理软件为Excel。
数据组成及字段解释如下: 表1:字段解释 字段名 解释 User_ID 用户ID Product_ID 商品ID Gender 性别(M:男,F:女) Age 年龄(分为0-17,18-25,26-35,36-45,46- 50,51-55,55以上) upation 职位(0,1,2,...20共21个类别) City_Category 城市类别(
A,B,C) Stay_In_Current_City_Years 在当地城市居住年限(0,1,2,3,4+) Marital_Status 婚姻状况(0-未婚,1-已婚) Product_Category_
1 商品类别
1(一级分类,不为空) Product_Category_
2 商品类别2(次级分类,可为空) Product_Category_
3 商品类别3(次级分类,可为空) Purchase 购买消费额(美元) 2.2数据清洗 通过查找主键User_ID与Product_ID的复合重复值,发现数据集并无重复数据。
通过Excel中Countblank函数查找每列的缺失值,发现仅 Product_Category_2和Product_Category_3两列存在大量缺失值,分别为166986条(31.0%)与373299条(69.4%,),其余列并无缺失值。
通过查看这两列的缺失值可知,顾客购买的商品所属类别可能属于类别
1,类别
2,类别3这三种情况中的某两类或者1类,也有可能同时隶属于三类,具体三种类别的含义及关系,这里由于数据中没有给出详细说明,所以暂无法确认。
因此,某一类别有缺失值是正常情况,故不删除列,用0填充缺失值。
考虑到每个人消费水平的不同,以及黑五购物节的促销性质,数据集可能出现较大的销售额。
又由于数据集并未给出具体销售物品清单,本文默认所有记录均正常,并未进行异常值删除。
经过以上清洗,可用数据为537577条,12列。
数据拥有完整性、准确性和规范性。
描述性分析 本节主要通过对数据的简单处理,通过数据透视图等工具对数据信息描述性分析,初步得到核心用户群体画像。
3.1因变量:销售额描述性统计 销售额为本数据集核心数据指标,在通过excel对其进行数据集中趋势分析后发现,平均数为9333.86,众数为6855,中位数8062,由于不确定具体消费明细,故不对异常值进行处理。
3.2性别分布分析 数据显示:此店在黑五期间男性消费者占比76.79%,女性消费者占比23.21%,男性消费者占比远高于女性,约呈3:
1。
说明女性消费较男性相对理性,黑五购物节男性是主要消费群体。
Purchase FM 图1:消费额性别分析 3.3年龄分布分析 数据显示:本次黑五购物节中“26-35岁”年龄群体为消费主力军,男女消费者在这个年龄段的比例都是最高的。
表2:消费额年龄分析 Age Purchase(TOTAL)Purchas(F)Purchase(M) 0-17 2.64% 3.59% 2.36% 18-25 17.97% 17.36% 18.15% 26-35 39.85% 37.25% 40.64% 36-45 20.14% 20.52% 20.03% 46-50 8.24% 9.86% 7.75% 51-55 7.21% 7.55% 7.11% 55+ 3.94% 3.86% 3.96% 总计 100.00% 100.00% 100.00% Purchase(TOTAL) 7.21%
3.94%2.64%17.97%8.24% 20.14% 39.85% 图2:消费额性别分析 0-1718-2526-3536-4546-5051-5555+ 3.4婚姻状态分析 饼状图显示:未婚人群消费占比高于已婚人士,达59%。
结合性别分析发现:当样本被分为四组:男性已婚,男性未婚,女性已婚与女性未婚(F_
0,F_
1,M_
0,M_1)。
数据显示,四个群体消费能力的排序为:M_0>M_1>F_0>F_
1。
未婚已婚 purchase 图3:消费额婚姻状态分析
0 2E+09 M_1M_0F_1F_
0 图4:婚姻状态性别复合分析 3.5城市分布分析 通过数据分析发现:用户主要分布在B类型的城市中,但城市分布相对差距不大,由于数据集无法得知B类型城市特征,猜测B类城市位于经济较繁荣且电商物流产业发达的地区。
同时通过分析消费者居住城市时长发现:黑五销售额在1年内会随着用户居住年限的增长而增长,而超过一年居住时长的用户购买力会随着年限增长而大幅下降。
这可能是由于在0-1年左右消费者刚刚进入城市居住,会在购物节大量采购生活用品,而后生活趋于稳定,他们会降低囤货量,回到正常消费水平。
32.66% City-type 25.82% ABC 41.52% 图5:消费额城市类型分析 千200000018000001600000140000012000001000000800000600000400000200000
0 672505.4290 Stay_years 1763243.917 934676.626
1 2 872531.133 图6:消费额城市居住年限分析 774711.2764+ 3.6职业分析 通过数据透视图分析发现,编号类别为:“4”、“0”、“7”的职业占据黑五消费主力,消费额分别占比13.1%,12.47%和10.95%。
猜测这几类职业收入较高,或者对价格敏感度较高。
700000000600000000500000000400000000300000000200000000100000000
0 upation 01234567891011121314151617181920 图7:消费额职业类型分析 3.7产品品类分析 用户购买产品品类大致呈现以下分布。
明显看出,1类商品最受欢迎,其次是5类和8类,比例远超其他种类,说明这三种品类的商品是用户主要的购买对象,推测可能为消费品或某类男性喜爱的用品。
40.00% Product_category 35.00% 30.00% 25.00% 20.00% 15.00% 10.00% 5.00% 0.00%
123456789101112131415161718 图8:消费额产品品类分析 3.7用户画像总结 根据以上分析,黑五购物节主要用户为26-35岁男性群体,单身群体主导。
主要分布在B类型城市,居住时长1年左右,以“4”、“0”、“7”三类职业为主。
购物节中最受他们欢迎的商品品类为1、5和
8。
诊断性分析 本节将对描述性分析所得用户基础画像进行进一步探索。
4.1相关性分析 本文进一步探索各变量的相关性。
通过在Excel计算相关系数以及热力图发现:Product_category_1与purchase呈较为明显的负相关,Product_category_2与Product_category_3也不同程度影响purchase。
说明产品品类是影响销售额的重要因素。
图9:热力图 4.2产品种类累积分析4.1相关性分析显示:产品品类对销售额有不同程度的重要影响。
因此本章 对核心销售品类进行累积分析。
折线图显示:1,5,8三类产品销售额占全品类75%左右,因此核心抓住前三类产品的销售情况。
120.00%100.00% 80.00%60.00%40.00%20.00% 0.00% 158623161110157414189171213 图9:产品种类累积分布 4.3复合指标分析 为了更好的研究用户特征,本文细化了用户分组。
首先结合年龄和性别,样本被分为14组(女性7组和男性7组)统计消费额总数。
图表显示,基本所有年龄段消费种类前三都是1、5和8类产品,具体排名有上下浮动,进一步印证4.2的结论。
140000000120000000100000000 80000000600000004000000020000000
0 Combined_age_gender_
F 系列1系列7系列13 系列2系列8系列14 系列3系列9系列15 系列4系列10系列16 系列5系列11系列17 图10:复合指标分析_age_gender_
F 系列6系列12系列18 700000000600000000500000000400000000300000000200000000100000000
0 Combined_age_gender_
M 系列1系列7系列13 系列2系列8系列14 系列3系列9系列15 系列4系列10系列16 系列5系列11系列17 图11:复合指标分析_age_gender_
M 系列6系列12系列18 其次结合性别和婚姻状态,各大产品品类不同群体消费额排序为:M_0>M_1>F_0>F_
1 Combined_marital_gender 1E+09900000000800000000700000000600000000500000000400000000300000000200000000100000000 0123456789101112131415161718 F_0F_1M_0M_
1 图12:复合指标分析_marital_gender 结论
1、黑五购物节主要用户为26-35岁男性群体,主要分布在B类型城市,居 住时长1年左右,以“4”、“0”、“7”三类职业为主。
购物节中最受他们欢迎的商品品类为1、5和
8。

2、产品品类对销售额有较为重要的影响。

3、单身群体消费在黑五购物节中较为明显。
建议
1、基于用户画像,产品设计与活动推广等需要迎合以男性26-35岁单身群体为主的群体等。
黑五前(预热环节)需要在多种媒体平台通过搜索分析或问卷方式获取最新的目标群体的具体需求,包括主要消费品类“1”、“5”和“8”中具体的产品,便于尽早调整营销策略。

2、广告重点投放在B类型城市与“4”、“0”、“7”三种职业的办公场所或上下班途中附近,提升核心用户的触达概率。

3、商家应重点对“1”、“5”和“8”品类的产品进行更新迭代,提升其魅力属性,让用户对品牌产生依赖,提升复购率。

4、单身群体为消费主力,单身经济影响显著。
购物商品、套餐等应最大程度贴合单身群体消费特征,推出单人份的礼盒或套餐;线上购物目前成为黑五销售的核心,一定程度契合单身经济发展,因此优化网购页面的分类、展示等功能有助于提升购物体验;产品物流配送等最大程度满足独居人士需求,推进020模式,提升配送效率。
参考文献 [1]郭师绪.“黑五”再引大战跨境电商迸发新活力[J].新产经,2019(12):7476.[2]刘益.紧跟“双11”洋码头亚马逊中国启动“黑五”[J].计算机与网络,2020,46(22):11.[3]苏鸣立.跨境电商“黑五”反客为主瓜分红利[J].计算机与网络,2019,45(24):10-11.[4]钟园园.从“黑五”到“线上周”:突围史上最难促销节[J].中国药店,2021(02):44-45.[5]周治忠.黑五接棒“双11”跨境电商迎接年末大考[J].计算机与网络,2020,46(23):10-11.

标签: #什么意思 #数据 #山西 #做什么 #分析师 #数据 #长尾词 #软件