注册
登录
提问时间:2016/6/30 11:43:36    楼主:未知网友   阅读量:6839
目前我初学爬虫,尽管简单的数据能抓下来,但是看了很多文章,里面有提到一些反爬虫的机制的,比如这两篇:
互联网网站的反爬虫策略浅析
Python简单抓取原理引出分布式爬虫
这里面都提到了用ip来反爬虫,第二篇文章也提到了用代理池来避免,但是还是不大明白,这些代理ip如果用nodejs要怎么弄?
1楼(未知网友)

对于淘宝(不开放API的) 一般的透明代理一点用都没有