平时在采集其它网站的文章,有图片的,直接引用原图片地址,而大部分图片都做了防盗链处理,为了能保证用户正常浏览,对抓取后的图片地址做了引用处理。 办法很多,参考鲜果和GoogleReader的方式,实际上就是通过伪装Referer信息来实现,这种方式的代码量以及图片下载响应速度的效果是最好的,还有用WebRequest和Iframe的方式也都可以达到我们的目的。 效果对比 图(1)采用“伪装Referer”的方式
图(2)采用"WebRequest"的方式
核心代码 1.伪装Referer方式 MSXML2.XMLHTTPClass oxmlHttp = new MSXML2.XMLHTTPClass(); oxmlHttp.open("Get", url, false, null, null); oxmlHttp.setRequestHeader("Referer", url); oxmlHttp.send("0"); if (oxmlHttp.readyState == 4 && oxmlHttp.status == 200) { return (Byte[])oxmlHttp.responseBody; } 2.WebRequest方式 WebRequest request = WebRequest.Create(url); WebResponse response = request.GetResponse(); Stream reader = response.GetResponseStream(); 3.Iframe方式 <script>var im = "<img src="图片URL" />";</script> <iframe id="im" style="border: 0px; overflow: hidden;" scrolling="no" frameborder="0" src="javascript:parent.im;" onload="javascript:var x=document.getElementById('im').contentWindow.document.images[0];this.width=x.width 10;this.height=x.height 10;"></iframe> 总结 |