拼多多市场大盘数据统计图表自动化3 - 自定义运算公式生成价格区间品牌分布占比

原创 电商记 新零售日志

访问电商记网站( dianshangji.com )安装电商记插件可使用本功能。

点击文章底部 [ 阅读原文 ] 链接可查看插件安装说明。


本文讲解《拼多多市场大盘数据统计图表自动化》的第3个数据处理流程, 自动生成价格区间字段,并生成每一个价格区间内月销售额前三的品牌占比图,以及每一个品牌的月销售额前三的价格区间占比图。

流程ID:7751

首先,我们采用一个关键词“牛仔裤”,采集拼多多的商品列表和属性列表的内容。
流程ID:7675
拼多多销量排序搜索结果的商品列表(关键词:牛仔裤, 页数:30,记录数:600)

流程ID:7696

拼多多详情页的属性列表(商品数:598)


本流程编写两个函数,第1个函数是“ 3a.从表格Sheet3创建价格区间字段 ”,用于从“价格”字段生成“价格区间”字段,代码如下所示:

这里使用了“列运算”积木块,对“价格”字段的每一个单元格内容,执行一个自定义的运算公式“FUNCTION1”。从“价格”中的每一个数值生成对应的“下限”和“上限”两个数值。
这段代码实现了这一过程,根据“价格”数值计算出区间的“下限”和“上限”。最后,将“下限”和“上限”两个数值拼接为字符串,放入“价格区间”这个列表。
运算结果将存于一个新的“价格区间”字段。表格内容如下所示:


流程编程的第2个函数是“ 3b.从表格Sheet3统计各价格区间前3个品牌生成表格 ”,用于生成每一个价格区间内月销售额前三的品牌占比图,以及每一个品牌的月销售额前三的价格区间占比图。

用一个变量“表格4.1”指向Sheet3表格名,其中包含第4阶段流程所生成的“价格区间”字段。用一个变量“表格5.1”指向Sheet4表格名,这是第5阶段流程将要创建的新表格,包含价格区间-品牌-月销售额总和这三个字段。用一个变量“表格5.2”指向“价格区间月销售额前三个品牌”表格名,由“表格5.1”进行统计分析后生成,包含价格区间-品牌-月销售额总和这三个字段。

对表格4.1进行查询,以“价格区间-品牌”作为分组,统计求和得到第三个字段,得到的结果保存为表格5.1。
查询RBQL语句如下。

SELECT a["价格区间"], a["品牌"], sum(a["月销售额"]) GROUP BY a["价格区间"], a["品牌"]

#TARGETHEADER *, 月销售额总和

对表格5.1的第三个字段命名为“月销售额总和”。


将表格5.1按“价格区间”和“月销售额总和”进行倒序排列。
SELECT * ORDER BY a["价格区间"], a["月销售额总和"] DESC

对表格5.1进行查询,按“价格区间”字段分组查询“月销售额总和”字段中数值排名前3的品牌,得到的结果保存为表格5.2。
查询RBQL语句如下所示。

SELECT top 3 * ORDER BY a["月销售额总和"] DESC

对表格5.2进行数据透视,以“品牌”作为左侧字段栏的行标签,以“价格”区间作为上方字段栏的列标签,以“月销售额总和”为求和数值绘制饼状图,生成每一个价格区间内月销售额前三的品牌占比图。

对表格5.2进行数据透视,以“价格区间”作为左侧字段栏的行标签,以“品牌”区间作为上方字段栏的列标签,以“月销售额总和”为求和数值绘制饼状图,生成每一个品牌的月销售额前三的价格区间占比图。

主流程调用上述两个函数的代码如下所示:


更多参考资料请访问网站社区的“拼多多”板块。


关于图形化编程的基础知识,请点击下面的《能格编程》图标,进入公众号教程。

学习图形化编程的最新课程,零基础入门,以3D沙盒游戏为练习环境,好学又好玩。这门课程很适合作为学习办公自动化和Python编程语言的预备课程。如果你想学习编程,或者想教孩子编程,那么这门课就是你的不二选择,欢迎关注公众号“能格编程”。

预览时标签不可点

微信扫一扫
关注该公众号

继续滑动看下一个
新零售日志
向上滑动看下一个
知道了
微信扫一扫
使用小程序
取消 允许
取消 允许
视频 小程序 ,轻点两下取消赞 在看 ,轻点两下取消在看 分享 留言 收藏