首先让我们整理一下现在面临的问题。
如果要采集一个商品详情页的 SKU 数据,我们需要操作 4 行积木块。如果我们想要获得一批商品详情页的 SKU 数据,例如 3 个竞品,那么至少要操作 3 次第四课的步骤。老老实实的一行一行搭建的话,我们需要拖入 2+3*4=14 行积木块。
显然,我们不可能用这样一个流程去采集成千上万的商品数据。
所以,既然我们要实现机器人自动化流程,那么接下来的学习任务也很明确了,就是用尽可能少的积木块,实现大量的步骤,特别是这种重复性非常高的“机械式”流程。
本课将介绍一个新的积木块——“循环”。我们将用它实现类似“把这几个步骤重复 1000 遍”这样的流程,从而避免人工重复搭建几千个积木块的问题。
从这一课开始,我们将真正进入自动化流程的搭建实验中。
绝大多数网页数据采集流程,都会用到循环类积木块,它是帮助我们节省人力成本的关键。常见于采集搜索结果、商品目录、订单列表、用户评论等具有多页内容的数据。
请读者跟着步骤试着搭建好这个流程,通过指定数量不同的商品详情页网址,反复运行,掌握循环类积木块的使用方法。
微信扫一扫
关注该公众号