说明:
协议头-插入域名:网站链接出现没有域名开头,会自动替换此处信息到链接中
过滤:替换几个完全无用的符号,如“#”
整站:只是相对性的爬取,我没去模仿引擎那样的
也就是说,1000个链接也许能获取完,也有可能只获取到900多,主要看你网站链接了
通畅能全部获取,反之只能获取大部分
替换协议头:https://及http://互换,也就是统一整体链接协议头,替换结果会转移到结果框
文件保存:只保存结果框内容
常见错误
停留在某一点不再继续执行:此站链接原因,相当于已经执行完成了。对于百度,360这些是家常便饭
耗时:会出现显示错误