asp獲取網頁源代碼并處理亂碼的方法
來源:
發布時間:2010/11/8
瀏覽次數:2172
asp獲取網頁源代碼的前提條件有兩個:一是服務器支持ADODB.STREAM組件,二是服務器安裝了XMLHTTP組件并允許調用。
如果您使用的空間是國內的,那么不必擔心,國內95%的空間都支持上面提到的兩個組件;如果您使用的空間是國外的,那就要注意了,因為國外絕大部分空間都不支持ADODB.STREAM組件或者XMLHTTP組件。所以,如果您需要這方面的服務,那么購買空間前,就要弄清楚。可以通過如下方法進行測試:
===〉測試空間是否支持ADODB.STREAM
===〉測試空間是否支持XMLHTTP
下面為asp獲取網頁源代碼的程序代碼:
<%
url="http://www.webkaka.com" '//定義要獲取源代碼的網址,一般是通過變量傳遞過來
HTMLCODE=getHTTPPage(url) '//獲取源代碼的函數
response.Write HTMLCODE '//輸出HTML格式的網頁內容
Function getHTTPPage(url)
dim objXML
set objXML=createobject("MSXML2.SERVERXMLHTTP.3.0") '調用XMLHTTP組件,測試空間是否支持XMLHTTP
objXML.open "GET",url,false 'false表示以同步的方式獲取網頁代碼,了解什么是同步?什么是異步?
objXML.send() '發送
getHTTPPage=bBytesToBstr(objXML.responseBody)'返回信息,同時用函數定義編碼
set objXML=nothing'關閉
End Function
Function bBytesToBstr(body)
dim objstream
set objstream = CreateObject("adodb.stream") '//調用adodb.stream組件
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset = "GB2312" '轉換原來默認的UTF-8編碼轉換成GB2312編碼,否則直接用XMLHTTP調用有中文字符的網頁得到的將是亂碼
bBytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
end Function
%>