控件中国网现已改版,您看到的是老版本网站的镜像,系统正在为您跳转到新网站首页,请稍候.......
中国最专业的商业控件资讯网产品咨询电话:023-67870900 023-67871946
产品咨询EMAIL:SALES@COMPONENTCN.COM

C#编程技巧:读取Word的方法

作者:不详 出处:IT专家网 2010年02月03日 阅读:

首先添加引用,解决方案资源管理器-》引用-》添加-》Com-》浏览-》C:\Program Files\Microsoft Office\OFFICE11\MSWORD.OLB 我使用的是office 2003其他版本我不太清楚,.net会自动把OLB控件转换成DLL文件

  使用方法:

     object oMissing = System.Reflection.Missing.Value;
  Word.Application oWord =new Word.Application();
  oWord.Visible = false;//设置Word应用程序为不可见
  //新建一个Word文档
  Word.Document oDoc=oWord.Documents.Add(ref oMissing,ref oMissing ,ref oMissing,ref oMissing);
  //文档内容的复制与粘贴
  oDoc.Content.Copy();
  oDoc.Content.Paste()
  //文档的另存为
  oDoc.SaveAs(ref fileName,ref saveFormat,ref oMissing,ref oMissing,ref oMissing,ref oMissing,ref oMissing,ref oMissing,ref oMissing,ref oMissing,ref oMissing,ref oMissing,ref oMissing,ref oMissing,ref oMissing,ref oMissing);
  //其他设置
  oDoc.PageSetup.PaperSize=Word.WdPaperSize.wdPaperA3;//页面设置
  oDoc.PageSetup.Orientation=Word.WdOrientation.wdOrientLandscape;//横板还是竖板
  oDoc.PageSetup.TextColumns.SetCount(2);//分栏
  //关闭Word
  oWord.Application.Quit(ref b,ref oMissing,ref oMissing);
  System.Runtime.InteropServices.Marshal.ReleaseComObject(oWord);

  通过oDoc对象对Word文档进行操作(word能做的它都能做)进行操作里面有很多函数,有兴趣的自己研究

  另一方法:

  1:对项目添加引用,Microsoft Word 11.0 Object Library

  2:在程序中添加 using Word = Microsoft.Office.Interop.Word;

  3:程序中添加

Word.Application app = new Microsoft.Office.Interop.Word.Application(); //可以打开word程序
  Word.Document doc = null; //一会要记录word打开的文档

  word文档和word程序可不是一回事奥!

  4:一般来说,对于抽取word内容,用的方法很少

     public override void openFile(object fileName){} //打开文档
  public override object readPar(int i){} //读取word文档的第i段
  public override int getParCount(){} //返回word文档一共几段
  public override void closeFile(){} //关闭文档
  public override void quit(){} //关闭word程序

  //从网页上拷贝的目录有时候会出现手动换行符^l,,先将其换成回车段落标记,才能正确读取

  public void replaceChar(){}

  5:代码


 public override void openFile(object fileName)
  ...{
  try
  ...{
  if (app.Documents.Count > 0)
  ...{
  if (MessageBox.Show("已经打开了一个word文档,你想关闭重新打开该文档吗?", "提示", MessageBoxButtons.YesNo) == DialogResult.Yes)
  ...{
  object unknow = Type.Missing;
  doc = app.ActiveDocument;
  if (MessageBox.Show("你想保存吗?", "保存", MessageBoxButtons.YesNo) == DialogResult.Yes)
  ...{
  app.ActiveDocument.Save();
  }
  app.ActiveDocument.Close(ref unknow, ref unknow, ref unknow);
  app.Visible = false;
  }
  else
  ...{
  return;
  }
  }
  }
  catch (Exception)
  ...{
  //MessageBox.Show("您可能关闭了文档");
  app = new Microsoft.Office.Interop.Word.Application();
  }
  try
  ...{
  object unknow = Type.Missing;
  app.Visible = true;
  doc = app.Documents.Open(ref fileName,
  ref unknow, ref unknow, ref unknow, ref unknow, ref unknow,
  ref unknow, ref unknow, ref unknow, ref unknow, ref unknow,
  ref unknow, ref unknow, ref unknow, ref unknow, ref unknow);
  }
  catch (Exception ex)
  ...{
  MessageBox.Show("出现错误:" + ex.ToString());
  }
  }
  public override object readPar(int i)
  ...{
  try
  ...{
  string temp = doc.Paragraphs[i].Range.Text.Trim();
  return temp;
  }
  catch (Exception e) ...{
  MessageBox.Show("Error:"+e.ToString());
  return null;
  }
  }
  public override int getParCount()
  ...{
  return doc.Paragraphs.Count;
  }
  public override void closeFile()
  ...{
  try
  ...{
  object unknow = Type.Missing;
  object saveChanges = Word.WdSaveOptions.wdPromptToSaveChanges;
  app.ActiveDocument.Close(ref saveChanges, ref unknow, ref unknow);
  }
  catch (Exception ex)
  ...{
  MessageBox.Show("Error:" + ex.ToString());
  }
  }
  public override void quit()
  ...{
  try
  ...{
  object unknow = Type.Missing;
  object saveChanges = Word.WdSaveOptions.wdSaveChanges;
  app.Quit(ref saveChanges, ref unknow, ref unknow);
  }
  catch (Exception)
  ...{
  }
  }
  public void replaceChar() ...{
  try
  ...{
  object replaceAll = Word.WdReplace.wdReplaceAll;
  object missing = Type.Missing;
  app.Selection.Find.ClearFormatting();
  app.Selection.Find.Text = "^l";
  app.Selection.Find.Replacement.ClearFormatting();
  app.Selection.Find.Replacement.Text = "^p";
  app.Selection.Find.Execute(
  ref missing, ref missing, ref missing, ref missing, ref missing,
  ref missing, ref missing, ref missing, ref missing, ref missing,
  ref replaceAll, ref missing, ref missing, ref missing, ref missing);
  }
  catch (Exception e)
  ...{
  MessageBox.Show("文档出现错误,请重新操作");
  }
  }

  6:刚才是用读取一段做的例子,如果要读取一句或一篇只需要把doc.Paragraphs[i](readPar中)改成doc.Sentences[i]或doc.content即可,因为都是微软的东东,所以用起来没有一点的障碍,再加上现在的vs2005做的很智能,所以先从java转到了c#上

  7:实际上,c#中读取word是不用那么麻烦的,但是如果考虑到可能还要抽取txt,ppt等多种格式,所以就写了一个抽象类,调用起来也方便,这就是为什么我的程序方法开头会有override的原因,总要考虑到通用,所以多了一些代码。

热推产品

  • ActiveReport... 强大的.NET报表设计、浏览、打印、转换控件,可以同时用于WindowsForms谀坔攀戀Forms平台下......
  • AnyChart AnyChart使你可以创建出绚丽的交互式的Flash和HTML5的图表和仪表控件。可以用于仪表盘的创......
首页 | 新闻中心 | 产品中心 | 技术文档 | 友情连接 | 关于磐岩 | 技术支持中心 | 联系我们 | 帮助中心 Copyright-2006 ComponentCN.com all rights reserved.重庆磐岩科技有限公司(控件中国网) 版权所有 电话:023 - 67870900 传真:023 - 67870270 产品咨询:sales@componentcn.com 渝ICP备12000264号 法律顾问:元炳律师事务所 重庆市江北区塔坪36号维丰创意绿苑A座28-5 邮编:400020
在线客服
在线客服系统
在线客服
在线客服系统