反爬虫

场景说明

网络爬虫是企业面临的安全挑战之一。恶意爬虫可能导致数据泄露和盗用、影响网站性能和可用性、数据被滥用对品牌产生负面影响等问题。

在与爬虫的持续对抗中,企业通常采用访问频率限制、验证码校验、黑白名单等手段来识别有问题的账户,但由于规律易被突破或数据库掌握不全等原因,难免出现漏封、误封。面对持续不断的黑产破解和日益更新的破解手段,通过X威胁情报API可以帮助企业增加识别爬虫风险的手段,为识别处置爬虫威胁提供有效的证据。

使用的X情报API

IP信誉API:https://x.threatbook.com/v5/apiDocs/ip/reputation

核心字段

is_malicious:是否为恶意IP。true代表恶意,false代表非恶意。

confidence_level:IP信誉情报信息的可信度。

judgments: IP地址的威胁情报判定标签,用于精细化过滤需要封禁的类型。

fraud.tag_name:IP欺诈作弊行为中具体的行为标签。

具体使用方法

具体步骤说明

img

  1. 从所有的入站访问日志中,筛选可疑日志,并提取互联网侧的源IP地址。

  2. 将源IP地址作为请求参数,调用IP信誉API进行查询。

  3. 基于IP信誉API的返回结果字段,制定有效识别爬虫的策略。具体策略建议如下:

策略条件策略说明
is_malicious=true && confidence_level="high" && judgments in "Dynamic IP" && judgments in ("Zombie" ,"Spam")所有判定为恶意,可信度高的IP,同时该IP地址为动态IP,且被标记傀儡机或垃圾邮件
judgements in "Dynamic IP" && fraud.tag_name="CaptchaCrack"被标记为动态IP,且同时被识别为存在验证码破解行为的IP
judgments in ("VPN" ,"Socks Proxy","HTTP Proxy","Tor")被识别为代理的IP,如该IP为VPN代理或Socks代理或HTTP代理或Tor代理
  1. 第3步结果中筛选出的IP地址,可作为业务侧基础反爬虫的补充或对问题IP提供处置依据,业务侧仍可结合访问次数、访问频率、黑白名单等因素进行综合决策,确认最终处置方式。
云API是北京微步在线科技有限公司旗下产品了解微步在线《用户服务条款》《数据保护政策》联系我们:api@threatbook.cn