电商记一键式网页采集器

📦下载插件安装包

📖插件安装说明书(任一Chrome浏览器插件的本地安装方法都是相同的)

常见使用场景

从 URL 列表中逐页抓取数据


如果你要抓取博客或目录类网站的内容,可以使用以下方法从一组 URL 中逐个抓取页面数据:

  1. 抓取 URL 列表

    • 导出为 CSV 文件

  2. 添加 URL

    • 在右上角菜单中选择“Scrape Details”(抓取详情)

    • 上传包含 URL 列表的 CSV 文件

    • 选择包含待抓取 URL 的列

  3. 选择元素

    • 创建一个新的页面抓取器

    • 在页面中选择你想要抓取的元素

    • 确认抓取器是否正确捕获了所有你需要的数据

  4. 开始抓取

    • 点击“开始抓取”,自动对每个页面进行抓取


故障排查

===============

抓取列表时的问题


抓取过早结束

如果在仍有更多内容的情况下抓取提前结束,请尝试调整设置以给予网站更多加载时间。

  • 增加最小等待时间:如果 电商记一键式网页采集器 在页面完全加载前就开始抓取,它可能会误以为没有更多内容可抓。

  • 增加最大等待时间:如果网站加载速度很慢,可以增加最大等待时间以确保新内容能加载完成。

  • 尝试聚焦正在抓取的标签页:有些网站只有在当前标签页处于前台时才会正常加载。你可以创建一个单独的窗口用于抓取,这样标签页就可以保持在最前面,而你仍可继续浏览其他网页。


如何加快抓取速度?

电商记一键式网页采集器 默认的设置适用于大多数网站,但有时你可能希望更快地提取数据。请注意合理使用,避免因请求过于频繁而影响目标网站运行,甚至被标记为可疑行为。

  • 禁用自动滚动:如果目标网站不会通过滚动加载新内容,可以关闭自动滚动以提升抓取速度。
  • 减少最小等待时间:减少抓取前的等待时间。注意:如果等待时间太短,可能导致页面未完全加载而无法正确获取数据。
  • 减少滚动延迟:加快滚动到每个项目的间隔时间。同样要注意,如果间隔太短,可能导致部分网站未能及时加载内容。

如何放慢抓取速度?

有时为了确保每个项目都完整加载,或者防止短时间内抓取过多数据,你可能需要放慢抓取速度。

  • 启用自动滚动:在提取数据时滚动到每个项目
  • 增加最小等待时间:强制 电商记一键式网页采集器 在抓取页面前多等一会儿
  • 增加滚动延迟:在滚动到每个项目前增加等待时间

抓取详情页的问题


如何在抓取前与页面互动(例如点击、输入)?

目前 电商记一键式网页采集器 不支持在抓取前与页面进行交互操作。对于更复杂的抓取任务,建议使用我们的两个高级自动化工具。

  • 积木式 积木式自动化工具

  • 节点式 节点式自动化工具


详情页抓取预览不显示数据

当你预览详情页抓取器时,如果页面加载较慢,测试链接中的数据可能无法正确显示。

在这种情况下,可以忽略预览并直接运行抓取器。你会发现实际运行时数据能够正确显示。如果网站加载较慢,别忘了适当增加最小等待时间!


其他问题

============

如果你在使用 电商记一键式网页采集器 时遇到任何问题(例如无法抓取某网站、数据缺失等),欢迎提交反馈报告:

回到首页