在首页下载的dxc采集,无法配置七牛云的对象存储。还有什么时候可以支持那些通过JavaScript加载的页面?
Zero 啥叫无法配置?
admin
admin 我确信我没有填错信息
Zero 好,记下来了。晚些我会联系你看看怎么回事
admin 还有 一个问题就是 在同一个 采集器里 无法二次采集 也就是说 用同一个采集器不清空数据时,第二次采集还是上一次的相同 显示 网址已访问过
admin 1208566076QQ
Zero 这是为了防止重复采集
admin 但是被采集网站对应的列表页面已经更新了 而软件没有更新导致还是采集的以前的页面 由于以前的已经采集过了 所以没有采集到任何东西
Zero 有没有办法,取消这防止采集的功能……有点时候采集错了,清空后再采集就不行了……
warsong 清除缓存
点击缓存后就这样了···
warsong 多试几次,都是这样?
admin 是的,没办法了 换了个系统……哈哈
warsong 解决了吗
admin 没有……直接换了个系统……应该是系统的问题,换了个系统就好了
admin 手动删除 C:\Users\username\AppData\Roaming\dxcspider\data\448\db\cacheUrlDB.db 应该也可以,可能就是因为数据量太大的问题
warsong 好的,你挺聪明,知道删除这个
admin 哈哈,看了一下那个目录,貌似数据都在里面,文件多,而且挺大的,就删了……
这个网址已访问过是有点坑。 有时候采集内容失败或为空,发布失败。 修正规则后 这些访问过的都不能继续采集发布了。
Lee168你用的是啥版本