ASP.NET用正则表达式获取文章中图片的地址

东明兄 2017-05-27
0条评论 1,351 次浏览
东明兄 2017-05-270条评论 1,351 次浏览

修改一个网站的布局的时候需要把简单的新闻列表修改为图文结合+新闻列表,不过这新闻的数据库非常简单,图片是在编辑器里面和HTML一起存入数据库中的content字段的,所以工作简化到从一个字符串里面获取图片的地址并输出。在HTML的图片标签一般如下格式所示:<img src=”” alt=”” title=”” width=”” height=”” />,这就相当于编程中的一个结构体啊,里面的一个个属性就是切入点,不过.NET中还没有函数去完成这个操作,算法有两个,一是根据查找字符串中是否有<img />标签,如果有的话输出src=””里面的地址;二是正则表达式,字符串中有满足正则的就输出src的值。前者经过实验效率不高并且程序总是出bug,后者简洁高效,是首选。

首先新建一个类:ImgHelper.cs,然后添加引用:using System.Text.RegularExpressions;,然后添加下面的代码:

class ImgHelper  
{  
    /// <summary>  
    /// 获取文章中图片地址的方法  
    /// </summary>  
    /// <param name="html">文章内容</param>  
    /// <param name="regstr">正则表达式</param>  
    /// <param name="keyname">关键属性名</param>  
    /// <returns></returns>  
    public static ArrayList getImgUrl(string html, string regstr, string keyname)  
    {  
        ArrayList resultStr = new ArrayList();  
        Regex r = new Regex(regstr, RegexOptions.IgnoreCase);  
        MatchCollection mc = r.Matches(html);  
  
        foreach (Match m in mc)  
        {  
            resultStr.Add(m.Groups[keyname].Value.ToLower());  
        }  
        if (resultStr.Count > 0)  
        {  
            return resultStr;  
        }  
        else  
        {  
            //没有地址的时候返回空字符  
            resultStr.Add("");  
            return resultStr;  
        }  
    }  
  
}  

在.aspx.cs文件中调用:

Image1.ImageUrl =ImgHelper.getImgUrl("字符串",@"<IMG[^>]+src=\s*(?:'(?<src>[^']+)'|""(?<src>[^""]+)""|(?<src>[^>\s]+))\s*[^>]*>", "src")[0].ToString();//这里是获取数组中第一个图片地址,当然也可以获取文章中其他图片,只需修改索引号。  

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注