45IT.COM- 电脑学习从此开始!
DIY硬件教程攒机经验装机配置
设计Photoshop网页设计特效
系统注册表DOS系统命令其它
存储主板显卡外设键鼠内存
维修显卡CPU内存打印机
WinXPVistaWin7unix/linux
CPU光驱电源/散热显示器其它
修技主板硬盘键鼠显示器光驱
办公ExcelWordPowerPointWPS
编程数据库CSS脚本PHP
网络局域网QQ服务器
软件网络系统图像安全
页面导航: 首页 > 设计学院 > 网络编程 > ASP教程 >

提取Html内容中的所有图片信息代码

电脑软硬件应用网 45IT.COM 时间:2009-04-22 23:18 作者:转载
很有意思的一段代码,代码实现对HTML内容中所有图片信息的提取,大家有时间的可以研究一下,完善一下程序。 protected ArrayList GetAList(string HtmlContent)
{
try
{
ArrayList arr = new ArrayList();
HtmlContent = content.Replace(\"\\r\\n\",\"\");
HtmlContent = content.Trim();

string partern = @\"\\<img(.*?)\\>\";//@\"<a (.*)>.*</a> \";//\"<a.*(?=Headline)(.|\\n)*?</a>\";//@\"/<a (.*)>.*<\\/\\a>/ \";


System.Text.RegularExpressions.Regex regex = new System.Text.RegularExpressions.Regex(partern, System.Text.RegularExpressions.RegexOptions.IgnoreCase);


System.Text.RegularExpressions.MatchCollection mc = regex.Matches(HtmlContent);

if(mc.Count <= 0)
return arr;
System.Text.RegularExpressions.Regex regex2 = new System.Text.RegularExpressions.Regex(@\"(\'|\"\"|/)?[\\w_()]*(.jpg|.bmp|.gif|.png|.jpeg)\",System.Text.RegularExpressions.RegexOptions.IgnoreCase);

foreach(Match m in mc)
{
System.Text.RegularExpressions.MatchCollection m2 = regex2.Matches(m.ToString());
if( m2.Count > 0 )
{
arr.Add( m2[0].ToString().Substring(1) );
}
}
return arr;

}
catch(Exception ex)
{
throw ex;
}

}
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
无法在这个位置找到: baidushare.htm
发表评论
请自觉遵守互联网相关的政策法规,严禁发布色情、暴力、反动的言论。
评价:
表情:
验证码:点击我更换图片
推荐知识