自动验证搜酷网址功能介绍
作者:辉创软件 来源:未知 浏览次数: 日期:2013-03-01 10:05
作者:辉创软件 来源:未知 浏览次数: 日期:2013-03-01 10:05
使用虫虫无类型抓取或其他第三方工具搜刮来的网址资源时,需要先识别网址的类型,虫虫才能调用相应的模块进行注册或发布。新版块优了自动验证内核,在验证速度和准确率性能上有了较大的提高,同时根据用户的不同需求,也提供了更多的验证方式。
在软件的菜单栏,选择“数据管理功能”,然后选择“导入网址(自动检测类型和有效性)”,设置相应的验证参数和网址文件(支持Excel和txt格式),就可以开始自动验证类型了。
验证语言一般可以选择“中英文”。验证方式选择的不同,验证的速率,准确率和成功率会有所不同。软件验证的原理是:首先判断网址的特征,如果没有相关特征,则连接页面判断页面特征,最后根据用户的选择方式,按有效性或注册进行最后的递归验证。验证分类一般全勾选即可。
软件目前统计支持的网址特征,单用户网址(即163,新浪等)有200多个,多用户网址(即Discuz模块等)有20多个(持续增加中);支持的页面特征共90多个。如下图所示:
部分多用户网址特征统计
部分多用户页面特征统计