前言:由于一個客戶的項目中需要將WORD文檔轉換成PDF格式,故寫了本篇實站教程 需求分析 :客戶的項目以B/S結構為主,提供一個WORD文件在后臺自動轉換成PDF,經(jīng)過實際測試,如果該篇WORD文檔有100多頁的話,轉換需要20分鐘左右的時間(環(huán)境:CPU是奔騰M 1.6G,512M內(nèi)存
前言:由于一個客戶的項目中需要將WORD文檔轉換成PDF格式,故寫了本篇實站教程
需求分析:客戶的項目以B/S結構為主,提供一個WORD文件在后臺自動轉換成PDF,經(jīng)過實際測試,如果該篇WORD文檔有100多頁的話,轉換需要20分鐘左右的時間(環(huán)境:CPU是奔騰M 1.6G,512M內(nèi)存),整個CPU的占用率近乎95%~100%,此結果告訴客戶以后,客戶提議:到客戶下班后,自動轉換PDF,同時如果使用人確認要查看該PDF文檔,如果沒有轉換,提供給客戶選擇,是現(xiàn)在轉換成PDF,還是由服務器在客戶下班后,自動轉換,
ASP.Net實現(xiàn)將Word轉換PDF格式_自動測試腳本語言
。項目功能:按需求分析要寫兩個功能
第一為:B/S結構后臺轉換,要提交給客戶選擇
第二為:Windows服務自動轉換WORD文檔到PDF
這兩個分類:核心的轉換程序都是采用線程的方式執(zhí)行,只不過第一個功能是針對一個WORD文件,第二個功能針對所有未轉換的WORD文檔.
分析到現(xiàn)在:我們開始實戰(zhàn)轉換了!
一:必備工具
安裝必須的工具MS VS.Net2003,MS Office2003,Adobe Acrobat 7.0 Professional,postscript.exe,gs811w32.exe
MS VS.Net2003的安裝不說明
MS Office2003的安裝不說明
Adobe Acrobat 7.0 Professional安裝說明
運行setup.exe文件,出現(xiàn)輸入序列號,就運行注冊機,用鼠標在第一行刷下就可以看見序列號,復制粘貼到Adobe Acrobat 7.0 Professional安裝程序對話框,安裝到最后出現(xiàn)注冊時,點擊PHONE...將安裝程序中顯示的第二行序列號(第一行是剛才注冊機生成的序列號)復制粘貼到注冊機的第二行,點擊右邊的按鈕,再用鼠標刷第三行授權號就出來了,將其復制粘貼到安裝程序的最后一行,完成安裝注冊!
postscript.exe默認安裝就可以了,它是一個PDF轉換時所需要的腳本
gs811w32.exe默認安裝就可以,它其實是個PDF虛擬打印機的驅動
二:配置虛擬打印機
進入Windows的控制面板,進入打印機,點擊"添加打印機"圖標.在安裝對話框上"按一步",出現(xiàn)選擇打印機時,在制造商一欄中選擇"Generic",在打印機一欄中,選擇"MS Publisher Color Printer",然后一路按下一步,知道安裝結束.
三:開始寫第一個程序(腳本程序)
為什么要使用腳本程序進行轉換呢,其實實際測試過程中,使用PDF Distiller的對象引用到C#后,轉換成功,但整個PDF Distiller對象不能釋放,第二次再轉換時,就發(fā)生了錯誤,故此處使用腳本程序實現(xiàn)轉換.這樣我們只要在C#的程序中調(diào)用腳本程序就可以實現(xiàn)WORD到PDF的轉換。
宿主腳本文件名:ConvertDoc2PDF.js
腳本文件內(nèi)容:
var files = WScript.Arguments;
var fso = new ActiveXObject("Scripting.FileSystemObject");
var word = new ActiveXObject("Word.Application");
var PDF = new ActiveXObject("PDFDistiller.PDFDistiller.1");
word.ActivePrinter = "MS Publisher Color Printer";
//files(0) 為WORD文檔文件名
//files(1) 為,轉換后需要保存的路徑
//調(diào)用fso.GetBaseName(files(0))后,為無路徑,無擴展名,的文件名
//files.length為文件參數(shù)的個數(shù),使用循環(huán)可以支持多個WORD文檔的轉換
var docfile = files(0);
var psfile = files(1) + fso.GetBaseName(files(0)) + ".ps";
var pdffile = files(1) + fso.GetBaseName(files(0)) + ".pdf";
var logfile = files(1) + fso.GetBaseName(files(0)) + ".log";
try{
var doc = word.Documents.Open(docfile);
//WORD文件轉成PS文件;
word.PrintOut(false, false, 0, psfile);
doc.Close(0);
//PS文件轉成PDF文件;
PDF.FileToPDF(psfile,pdffile,"");
fso.GetFile(psfile).Delete();//刪除PS腳本文件
fso.GetFile(logfile).Delete();//刪除轉換的日志文件
word.Quit();
WScript.Echo("isuclearcase/" target="_blank" >ccess");//成功
WScript.Quit(0);
}
catch(x)
{
word.Quit();
WScript.Echo("isfail");//失敗
WScript.Quit(0);
}
然后測試該腳本程序
啟動MS-DOS,輸入如下命令:
c:\>cscript. //nologo c:\ConvertDoc2PDF.js c:\test.doc c:\
說明:
運行成功后將看到test.pdf文檔了
c:\test.doc參數(shù)對應的是腳本程序中的files(0)
c:\參數(shù)對應的是腳本程序中的files(1)
你可以安照該腳本改寫成,支持多個參數(shù),使用FOR循環(huán),一次轉換多個WORD文檔,此處沒有使用多個文件轉換功能,是考慮到,該段腳本放在C#的線程中執(zhí)行,這樣一來也可以轉換多個WORD文檔.
四:使用C#調(diào)用ConvertDoc2PDF.js腳本
新建一個C#的WINDOWS應用程序,添加一個按鈕button1
添加一個函數(shù),函數(shù)名StartConvertPDF
public void StartConvertPDF()
{
Process proc = new Process();
proc.StartInfo.FileName = "cmd.exe";
proc.StartInfo.WorkingDirectory = @"c:\";
proc.StartInfo.CreateNoWindow = true;
proc.StartInfo.UseShellExecute = false;
proc.StartInfo.RedirectStandardInput = true; //輸入重定向
proc.Start();
proc.StandardInput.WriteLine(@"cscript. //nologo c:\ConvertDoc2PDF.js c:\test.doc c:\");
proc.StandardInput.WriteLine("exit");
proc.WaitForExit();
}
然后在按鈕的CLICK事件中添加調(diào)用線程的代碼
private void button1_Click(object sender, System.EventArgs e)
{
//定義線程序
Thread thConvert = new Thread(new ThreadStart(StartConvertData));
thConvert.Start();
}
注意:在測試上面的C#程序時,必須添加如下命名空間
using System.Diagnostics;
using System.Threading;
五:健壯的C#調(diào)用代碼(實際考慮,可放在B/S系統(tǒng)中)
完成第4步的C#測試后,細心的讀者,可能看到一點問題,那就是如何得到腳本運行后輸出的結果,如何給線程中調(diào)用的StartConvertData方法傳遞參數(shù)
1:傳遞參數(shù),此話說來也可用一篇教程告訴大家線程中方法如何來傳遞參數(shù),現(xiàn)在就講一個方案,此種方案很多,我采用一個類,初始化這個類,然后調(diào)用該類的方法作為線程執(zhí)行的方法
2:得到腳本的輸出結果,使用Process對象的輸出重定向,就是說改變輸出方向,使腳本不輸出到控制臺(MS-DOS窗口),而是重定向輸出到C#程序中,并采用線程的異步回調(diào)方法,顯示腳本運行結果,
備考資料
《ASP.Net實現(xiàn)將Word轉換PDF格式_自動測試腳本語言》(http://www.szmdbiao.com)。添加一個新類,類名為ToPdf
using System;
using System.Diagnostics;
using System.ComponentModel;
using System.Windows.Forms;
using System.Data;
namespace Doc2Pdf
{
public class ToPdf
{
private string strWord = "";//此處的WORD文件不含路徑
private string sPath = "";
public string sExecResult = "";
public bool bSuccess = false;
public ToPdf(string sParamWord,string sParamPath)
{
strWord = sParamWord;
sPath = sParamPath;
}
public void StartConvertPDF()
{
Process proc = new Process();
proc.StartInfo.FileName = "cmd.exe";
proc.StartInfo.WorkingDirectory = sPath;
proc.StartInfo.CreateNoWindow = true;
proc.StartInfo.UseShellExecute = false;
proc.StartInfo.RedirectStandardInput = true;//標準輸入重定向
proc.StartInfo.RedirectStandardOutput = true;//標準輸出重定向
proc.Start();
proc.StandardInput.WriteLine("cscript. //nologo "+sPath+"ConvertDoc2PDF.js "+sPath+strWord+ " "+sPath);
proc.StandardInput.WriteLine("exit");
sExecResult = proc.StandardOutput.ReadToEnd();//返回腳本執(zhí)行的結果
proc.WaitForExit();
proc.Close();
}
public void EndConvertPDF(System.IAsyncResult ar)//ar參數(shù)必須寫,是線程執(zhí)行完成后的回調(diào)函數(shù)
{
if(sExecResult.IndexOf("isuccess")!=-1)bSuccess=true;
else if(sExecResult.IndexOf("isfail")!=-1)bSuccess=false;
//如果放在B/S系統(tǒng),你可以在此處寫數(shù)據(jù)庫,是成功還是失敗,并用一個WEBService程序不斷檢查數(shù)據(jù)庫,此WEBService程序不放在該回調(diào)用函數(shù)中
//如果放在C/S系統(tǒng),回調(diào)函數(shù)可以不放在類中,以便在窗體程序中調(diào)用結果
}
}
}
改寫原來的button1_Click事件中的代碼
private void button1_Click(object sender, System.EventArgs e)
{
ToPdf my2Pdf = new ToPdf("test.doc","c:\\");
ThreadStart thStartConvert = new ThreadStart(my2Pdf.StartConvertPDF); //開始異步調(diào)用線程
thStartConvert.BeginInvoke(new AsyncCallback(my2Pdf.EndConvertPDF),null);//設置異步線程的回調(diào)函數(shù)
//如果需要轉換多個WORD,你可以用循環(huán)
//如果是B/S系統(tǒng),可以將本段代碼放在ASPX中,并結合客戶端的無刷新顯示數(shù)據(jù)的技術,不斷訪問WEBService程序,以確定PDF是否轉換成功或失敗
}
六:編寫更加健壯的C#調(diào)用代碼(實際考慮,可放在WINDOWS的服務程序中)
實際使用時,由于轉化PDF時CPU的占用率很高,考慮只在同一時間轉換一篇WORD文檔,放棄異步線程的回調(diào)函數(shù)的使用,考慮一個WINDOWS的服務程序。
寫一個函數(shù)CheckData2Convert(),不斷的檢查沒有轉換的WORD文檔,并使用循環(huán)調(diào)用ToPdf類中執(zhí)行轉換方法StartConvertPDF
//以下給出,泛代碼,用戶按照自己的需求,填寫完整即可
//bool bStart為全局變量,控制循環(huán)的進入與退出
//例:18:30開始檢查并轉換,那么18:30時,bStart=true;并啟動轉換線程
//6:30停止轉換線程,bStart=fasle;
private void CheckData2Convert()
{
//檢查指定目錄下的沒有轉換的WORD文檔,你同樣可以檢查數(shù)據(jù)庫中記錄的沒有轉換的WORD文檔
string sPath = System.Threading.Thread.GetDomain().BaseDirectory; //當前的路徑
while(bStart)
{
int iFileCount = CheckWord(); //CheckWord為一個方法,檢查當前沒有轉換的WORD文檔,返回沒有轉換的文件數(shù),該方法的代碼由讀者自己編寫
for(int i=0;i { string sWord = GetWordFileName(i) //GetWordFileName為一個方法,返回一個不帶路徑的WORD文件名,該方法的代碼由讀者自己編寫 //ToPdf類中的StartConvertPDF()方法使用的是不帶路徑的WORD文件名 ToPdf my2Pdf = new ToPdf(sWord ,sPath); my2Pdf.StartConvertPDF(); if(my2Pdf.sExecResult.IndexOf("isuccess")!=-1) { //成功,寫日志,或回寫數(shù)據(jù)庫 } else if(my2Pdf.sExecResult.IndexOf("isfail")!=-1) { //失敗,寫日志,或回寫數(shù)據(jù)庫 } } if(!bStart)break; Thread.Sleep(1000); } } 然后在服務的開始事件中,啟動線程 protected override void OnStart(string[] args) { //可以使用一個開始定時器,檢查是否到開始時間,時間一到,就開始執(zhí)行線程,此處的開始執(zhí)行線程可以放在開始定時事件中 //可以使用一個結束定時器,檢查是否到結束時間,時間一到,就結束線程,結束線程的代碼可以放在結束定時事件中 //注意:應該使用組件中的定時器,而不是Windows的FORMS中的定時器 //該定時器的類名為System.Timers.Timer,千萬別搞錯,不然執(zhí)行不會正常的 bStart = true; Thread thConvert = new Thread(new ThreadStart(StartConvertData)); thConvert.Start(); } 然后在服務的結束事件中,設置停止線程的標識bStart= false protected override void OnStop() { bStart = false; //為何次處不停止線程呢,因為考慮到,現(xiàn)在線程正在轉換WORD文檔,但沒有結束,所以只設置停止標識,轉換完成后,線程也執(zhí)行結束了. } 結束語: Adobe Acrobat 7.0 Professional,postscript.exe,gs811w32.exe這三個文件可以在itbaby.jss.cn下載,都包含在同一個RAR的壓縮文件中了。 itbaby.jss.cn是動態(tài)域名,主機在作者家里,如果網(wǎng)站不能訪問,說明電腦沒有開,請稍后幾天再試。 原文轉自:http://www.ltesting.net