关于‘’抓取结构化数据”组件的使用 提问 组件

张孝志 5天前 86

关于“抓取结构化数据”组件的使用,有两个疑问:

1、如果不想限制最大抓取数量,将属性留空即可还是设置成特定的值?

2、当进行多页面翻页抓取时,如果可用页面已经耗尽,如何让组件的运行停止而不是持续等待?

例如,尝试在网页“http://www.fortunechina.com/fortune500/c/2020-08/10/content_372148.htm”中抓取500强公司榜单数据。该榜单一共10页。使用该组件进行数据抓取,但页面切换到第10页后,流程无法结束,一直停在该组件的运行状态中。附图是组件的属性设定。


最后于 5天前 被张孝志编辑 ,原因:
上传的附件:
最新回复 (2)
  • 0 引用 2
    你好,能否看下executor的日志,位置在%userprofile%\AppData\Local\Encoo\Log下,executor开头的文件
    5天前 收起回复
    张孝志: 你好,添加了附件。
    5天前回复
  • 0 引用 3
    这个是组件问题,你把“最大提取条数”设置成表格数据总条数就行了
    4天前 收起回复
    张孝志: 谢谢答复。不过,如果有些场合无法事先知道数据总数怎么处理?
    4天前回复
返回