数据分析之初心-交易流水信息分析
拿到一份某平台五天的交易流水数据表。所有的信息都只是交易信息,需要再筛选加工一下才能要对该表做近一步数据分析。我们依然按照提出问题,理解数据,数据清洗,构建模型这一个顺序进行。
处理交易信息,并将杂乱的流水报表梳理整合,关注的重点在销售额是多少?毛利额毛利率是多少?哪些商品卖得最好?哪些商品卖得不好?每天下单的商户有多少等等。
1.提出问题
首先提出问题,这里我们只选取几个维度来思考问题,分别是这五天每天的下单金额;五天内哪些商品的销量最好,分别卖了多少;每个单品的销量在总销量的占比是多少;每天的交易商户有多少个。
2.理解数据
由于信息量很大,必须选择有针对问题选择有针对性的字段。分别选择下单金额,商品通用名,商户id这三个字段。
3.数据清洗
针对这三列的数据,删除重复项;查找缺失值;查找是否有字符型数字并转换为数字型;一致化处理。
4.构建模型
运用数据透视表功能,选择对应的字段我们就拿到了想要的结果
结论:最终拿到了想要的结果,分析这几天的数据,鸡蛋+油+土豆是卖得最好得前3个商品;就销售额而言5.3日这一天销售额最高,而5.5日销售额最低;如果再从商户数这个角度看,5.2日这一天购买的商户数最多,而5.5日依旧是最低的。
后期学完数据可视化,再把它应用起来做成报表和ppt,最终呈现出来的结果就十分完美了。