mysql前五个最多的客户职业_用户分析!
mysql前五个最多的客户职业_用户分析!
数据解读:
User_ID:用户ID,每个用户唯一标识
Product_ID:商品ID,每个商品唯一标识
Gender:用户性别,F为女性,M为男性
Age:用户年龄段
Occupation:用户职业,用编号显示
City_Category:用户来源城市类别,分为A、B、C
Stay_In_Current_City_Years:用户在当前城市居住年数,分为0、1、2、3、4+
Marital_Status:用户婚姻状况,1为已婚,0为未婚
Product_Category_1:商品所属分类1,不可为空
Product_Category_2:商品所属分类2,可为空
Product_Category_3:商品所属分类3,可为空
Purchase:用户本条记录消费金额(美元)
同一件商品可能属于多种分类,比如一件“男士运动T恤”属于 1. 服装、 2. 体育、 3. 男士 三种分类
查询数据基本信息情况:
1. 有多少条数据
SELECT COUNT(*) FROM blackfriday;
2. 有多少用户
SELECT COUNT(DISTINCT Userid) FROM blackfriday;
3. 商品种类有多少
SELECT COUNT(DISTINCT Product_ID) FROM blackfriday;
4. 年龄分段。
SELECT DISTINCT Age FROM blackfriday;
5. 多少种职业
SELECT DISTINCT Occupation FROM blackfriday ORDER BY Occupation;
6. 不同城市来源
SELECT DISTINCT City_Category FROM blackfriday;
7. 居住年限
SELECT DISTINCT Stay_In_Current_City_Years FROM blackfriday;
8.婚姻状况
SELECT DISTINCT Marital_Status FROM blackfriday;
9.多少种商品
SELECT DISTINCT Product_Category_1 FROM blackfriday ORDER BY Product_Category_1;
得到的结果分别是:
1. 一共有537577条数据。
2. 5891个不同用户。
3. 3623个不同商品。
4. 7个年龄段,分别为: 0-17、18-25、26-35、36-45、46-50、51-55、55+。
5. 21种职业,编号为 0-20
6. 3类城市,分别为 A、B、C。
7. 居住年限为0、1、2、3、4+ 。
8. 1为已婚,0为未婚。
9. 18种商品分类,编号 1-18。
一、商品销售情况
根据这个表中数据,我们将进行如下分析:
1. 哪些商品最受顾客喜欢?找出排名前40的商品。
通过去重、统计、排序截取了购买次数最多的前40种商品。
SELECT Product_ID '产品ID',COUNT(Userid) '购买数',Product_Category_1 '商品分类' FROM blackfriday GROUP BY Product_ID ORDER BY 购买数 DESC;
通过查询结果我们可以看出,购买人数最多的商品是产品ID为P00265242商品类别是5类的商品,但是商品类别中最受欢迎的是1类商品。
2. 哪些商品销售金额最高?找出排名前40的商品。
通过去重、统计、排序截取了销量最大的前40种商品。
SELECT Product_ID '产品ID',SUM(Purchase) '销售额',Product_Category_1 '商品分类' FROM blackfriday GROUP BY Product_ID ORDER BY 销售额 DESC LIMIT 40;
从排行榜中可以看出销售金额最高的产品是P00025442,商品类别为1类,还发现销售额较高的也基本都是1类商品。
3. 查看各类商品销售次数。
4. 查看各类商品销售金额。
5.将各类商品销售次数和各类商品销售金额的结果输出,结合Excel绘图。
商品销售数量和销售额最大的是1L、5L、8L,销售数量和销售额最小的分别是7L、18L商品。
二、用户消费情况
1. 不同年龄段的购买的商品类别数量?
SELECT Age '年龄段',COUNT(DISTINCT Userid) '人数',SUM(Purchase) '消费总额',SUM(Purchase)/ COUNT(DISTINCT Userid) '平均消费'
FROM blackfriday GROUP BY 年龄段 ORDER BY 消费总额 DESC;
从显示结果中看出,顾客人群在26-35、36-45这两个年龄段之间的居多,人均消费也是最高,说明这两个年龄段对消费力度影响最大。
2. 不同职业消费情况?
SELECT Occupation '职业',COUNT(DISTINCT Userid) '人数',SUM(Purchase) '消费总额',SUM(Purchase)/ COUNT(DISTINCT Userid) '平均消费'
FROM blackfriday GROUP BY 职业 ORDER BY 消费总额 DESC;
从结果中可以看出职业类别为4的人数最多,职业类别为20的人均消费最高,而职业类别为13的人均消费水平最低。
3. 性别分布和消费情况。(F为女性,M为男性)
SELECT Gender '性别',COUNT(DISTINCT Userid) '人数',SUM(Purchase) '销售额’
FROM blackfriday GROUP BY 性别;
顾客群体中,女性顾客明显少于男性顾客。
4. 不同城市的顾客人数和消费情况。
SELECT City_Category '城市',COUNT(DISTINCT Userid) '人数',SUM(Purchase) '销售额',SUM(Purchase)/COUNT(DISTINCT Userid) '平均消费'
FROM blackfriday GROUP BY 城市 ORDER BY 平均消费 DESC;
来自C成的人最多,但是总销售额不高,人均消费也是最低,而来自A城的人最少,人均消费最高,可以看出来自A城人经济状况不错。
5. 婚姻状况和消费情况。(1为已婚,0为未婚)
SELECT Marital_Status '是否结婚',COUNT(DISTINCT Userid) '人数',SUM(Purchase) '销售额',SUM(Purchase)/COUNT(DISTINCT Userid) '平均消费'
FROM blackfriday GROUP BY 是否结婚;
从查询结果可以看出,未婚居多,但婚姻状态对购买力没什么影响。
通过以上分析,我们可以推断出潜在的高价值顾客大概是这样一个情况:年龄在26-45之间,性别为男,来自A城,职业类别可能是20、4。
7. 高价值用户查找。
(1)查找消费额度排名前40位顾客。
SELECT Userid '顾客ID',Gender '性别',Age '年龄段',Occupation '职业',City_Category '城市',Stay_In_Current_City_Years '居住时长',Marital_Status '婚否',SUM(Purchase) '总消费额'FROM blackfriday GROUP BY Userid ORDER BY SUM(Purchase) DESC LIMIT 40;
(2)购买商品数排名前40位顾客。
通过以上分析,我们可以推断出潜在的高价值顾客大概是这样一个情况:年龄在26-45之间,性别为男,来自A城,职业类别可能是20、4。
消费额度排名榜和购买商品数排名榜大部分数据重合,可以看出高价值的顾客基本是来自A城的男性,年龄在26-45之间,职业类别20、4均在其中。得出的结果符合之前的分析结论。
用户分布统计图
从统计图形看:
1. 销售额度主力军的客户群体为男性,占据销售总额度的77%。
2. 客户年龄多数在26-35之间,其次是36-45之间,他们共占据了销售总额度的60%。
3. 从总体看,婚姻状况对销售总额度有一定的影响,其中未婚顾客的销售总额度达到59%,而已婚顾客是41%。
4. 来自A、B、C城市的客户中,B城销售额度最大,为41%。前面虽然分析出大客户主要集中于来自A城的客户,但是来自A城的人数是A、B、C三城中最少的。
5. 职业类别中以职业类别4的销售最高,其次是职业类别0和7,最低的是职业类别8,结合前面的分析,职业类别8的人数是最少的,只有17人。
学习资料见知识星球。
以上就是今天要分享的技巧,你学会了吗?若有什么问题,欢迎在下方留言。
快来试试吧,小琥 my21ke007。获取 1000个免费 Excel模板福利!
更多技巧, www.excelbook.cn
欢迎 加入 零售创新 知识星球,知识星球主要以数据分析、报告分享、数据工具讨论为主;
1、价值上万元的专业的PPT报告模板。
2、专业案例分析和解读笔记。
3、实用的Excel、Word、PPT技巧。
4、VIP讨论群,共享资源。
5、优惠的会员商品。
6、一次付费只需99元,即可下载本站文章涉及的文件和软件。
共有 0 条评论