如何检测是否为爬虫IP?

小轻官方 小轻官方 关注 运营团队 高级会员
发表于网络技能版块 代码,求助

方法一:


通过国外网站验证:http://bot.myip.ms/123.125.71.12


返回结果:


IP/Domain - 123.125.71.12:

 

Baidu Bot on this IP address - See more at: http://bot.myip.ms/123.125.71.12#sthash.Ax4dx8s5.dpuf


Image


方法二:


在linux平台下,您可以使用host ip命令反解 ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname


host :

[root@baoshan temp]# host 123.125.71.12

12.71.125.123.in-addr.arpa domain name pointer baiduspider-123-125-71-12.crawl.baidu.com.


方法三:windows平台

C:\Users\user>nslookup 123.125.71.12


服务器: UnKnown

Address: 218.241.116.153


名称: baiduspider-123-125-71-12.crawl.baidu.com

Address: 123.125.71.12


参考资料:

1.http://blog.goyiyo.com/archives/1978

2.http://bot.myip.ms


代码:

#!/bin/bash

cat sourceip.txt | while read ip 
do 
curl bot.myip.ms/$ip | grep "Bot on this IP address" >> ./a.txt 
if [ $? -ne 0 ]; then
echo $ip" NOT" >> result
else
echo $ip" Bot" >> result
fi
done

评论列表 评论
发布评论

评论: 如何检测是否为爬虫IP?

拖动滑块验证
»
已有0次打赏