控件中国网现已改版,您看到的是老版本网站的镜像,系统正在为您跳转到新网站首页,请稍候.......
中国最专业的商业控件资讯网产品咨询电话:023-67870900 023-67871946
产品咨询EMAIL:SALES@COMPONENTCN.COM

C#(ASP.net)从其他网站抓取内容并截取有用信息

作者:佚名 出处:互联网 2011年09月27日 阅读:

C#(ASP.net)从其他网站抓取内容并截取有用信息
 
1. 需要引用的类库

view sourceprint?1 using System.Net; 

2 using System.IO; 

3 using System.Text; 

4 using System.Text.RegularExpressions;


2. 获取其他网站网页内容的关键代码

view sourceprint?1 WebRequest request = WebRequest.Create("http://目标网址.com/"); 

2 WebResponse response = request.GetResponse(); 

3 StreamReader reader = new StreamReader(response.GetResponseStream(), Encoding.GetEncoding("gb2312")); 

4 //reader.ReadToEnd() 表示取得网页的源码 

5 TextBox1.Text = reader.ReadToEnd();

 

3. 获取其他网站网页源码之后通过{正则表达式}帅选有用信息


view sourceprint?1 MatchCollection TitleMatchs = Regex.Matches(reader.ReadToEnd(), @"发表评论</a></p></div><div class=""body"">([\s\S]*?)</div><div class=""share"">", RegexOptions.IgnoreCase | RegexOptions.Multiline); 

2 foreach (Match NextMatch in TitleMatchs) 

3 { 

4     s += "<br>" + NextMatch.Groups[1].Value; 

5     TextBox1.Text += "\n" + NextMatch.Groups[1].Value; 

6 }

RegexOptions.IgnoreCase: 表示不区分大小写, 一般网站源码大小写不敏感所以取消之.


RegexOptions.Multiline: 表示对多行内容进行帅选.

 

热推产品

  • ActiveReport... 强大的.NET报表设计、浏览、打印、转换控件,可以同时用于WindowsForms谀坔攀戀Forms平台下......
  • AnyChart AnyChart使你可以创建出绚丽的交互式的Flash和HTML5的图表和仪表控件。可以用于仪表盘的创......
首页 | 新闻中心 | 产品中心 | 技术文档 | 友情连接 | 关于磐岩 | 技术支持中心 | 联系我们 | 帮助中心 Copyright-2006 ComponentCN.com all rights reserved.重庆磐岩科技有限公司(控件中国网) 版权所有 电话:023 - 67870900 传真:023 - 67870270 产品咨询:sales@componentcn.com 渝ICP备12000264号 法律顾问:元炳律师事务所 重庆市江北区塔坪36号维丰创意绿苑A座28-5 邮编:400020
在线客服
在线客服系统
在线客服
在线客服系统