电商记一键式网页采集器
📖插件安装说明书(任一Chrome浏览器插件的本地安装方法都是相同的)
常见使用场景
从 URL 列表中逐页抓取数据
如果你要抓取博客或目录类网站的内容,可以使用以下方法从一组 URL 中逐个抓取页面数据:
-
抓取 URL 列表
-
导出为 CSV 文件
-
-
添加 URL
-
在右上角菜单中选择“Scrape Details”(抓取详情)
-
上传包含 URL 列表的 CSV 文件
-
选择包含待抓取 URL 的列
-
-
选择元素
-
创建一个新的页面抓取器
-
在页面中选择你想要抓取的元素
-
确认抓取器是否正确捕获了所有你需要的数据
-
-
开始抓取
-
点击“开始抓取”,自动对每个页面进行抓取
-
故障排查
===============
抓取列表时的问题
抓取过早结束
如果在仍有更多内容的情况下抓取提前结束,请尝试调整设置以给予网站更多加载时间。
-
增加最小等待时间:如果 电商记一键式网页采集器 在页面完全加载前就开始抓取,它可能会误以为没有更多内容可抓。
-
增加最大等待时间:如果网站加载速度很慢,可以增加最大等待时间以确保新内容能加载完成。
-
尝试聚焦正在抓取的标签页:有些网站只有在当前标签页处于前台时才会正常加载。你可以创建一个单独的窗口用于抓取,这样标签页就可以保持在最前面,而你仍可继续浏览其他网页。
如何加快抓取速度?
电商记一键式网页采集器 默认的设置适用于大多数网站,但有时你可能希望更快地提取数据。请注意合理使用,避免因请求过于频繁而影响目标网站运行,甚至被标记为可疑行为。
- 禁用自动滚动:如果目标网站不会通过滚动加载新内容,可以关闭自动滚动以提升抓取速度。
- 减少最小等待时间:减少抓取前的等待时间。注意:如果等待时间太短,可能导致页面未完全加载而无法正确获取数据。
- 减少滚动延迟:加快滚动到每个项目的间隔时间。同样要注意,如果间隔太短,可能导致部分网站未能及时加载内容。
如何放慢抓取速度?
有时为了确保每个项目都完整加载,或者防止短时间内抓取过多数据,你可能需要放慢抓取速度。
- 启用自动滚动:在提取数据时滚动到每个项目
- 增加最小等待时间:强制 电商记一键式网页采集器 在抓取页面前多等一会儿
- 增加滚动延迟:在滚动到每个项目前增加等待时间
抓取详情页的问题
如何在抓取前与页面互动(例如点击、输入)?
目前 电商记一键式网页采集器 不支持在抓取前与页面进行交互操作。对于更复杂的抓取任务,建议使用我们的两个高级自动化工具。
详情页抓取预览不显示数据
当你预览详情页抓取器时,如果页面加载较慢,测试链接中的数据可能无法正确显示。
在这种情况下,可以忽略预览并直接运行抓取器。你会发现实际运行时数据能够正确显示。如果网站加载较慢,别忘了适当增加最小等待时间!
其他问题
============
如果你在使用 电商记一键式网页采集器 时遇到任何问题(例如无法抓取某网站、数据缺失等),欢迎提交反馈报告: