タイトル | : Re^5: Webbrowser.DocumentからHTMLでタグのないテキストを取得したい |
記事No | : 2442 |
投稿日 | : 2005/10/19(Wed) 23:36 |
投稿者 | : YAS |
[OSのVer]:Windows [VBのVer]:VB.NET 魔界の仮面弁士さんのヒントからMSHTMLをさらに調べ,以下のコードで 希望の結果を得ることができました!!
(プロジェクトにMSHTMLオブジェクトライブラリの参照を追加する) Imports MSHTML
Public Class Form1
Dim Idt As Integer
Private Sub Form1_Load(ByVal sender As Object, ByVal e As System.EventArgs) _ Handles Me.Load Me.WebBrowser1.Navigate(Application.StartupPath & "\test.html") End Sub
Private Sub WebBrowser1_DocumentCompleted(ByVal sender As Object, _ ByVal e As System.Windows.Forms.WebBrowserDocumentCompletedEventArgs) _ Handles WebBrowser1.DocumentCompleted Dim myDoc As HTMLDocument = Me.WebBrowser1.Document.DomDocument PrintNodeTree(myDoc.body) myDoc.close() End Sub
Private Sub PrintNodeTree(ByVal Node As IHTMLDOMNode) For Each cNode As IHTMLDOMNode In Node.childNodes Debug.Print(Space(Idt) & "<" & cNode.nodeName & ">") If Not cNode.nodeValue Is DBNull.Value Then Debug.Print(Space(Idt) & cNode.nodeValue) End If If cNode.hasChildNodes Then Idt += 4 PrintNodeTree(cNode) End If Next Idt -= 4 End Sub
End Class
ご助言いただいたみなさんのおかげで(たぶん)解決いたしました。 ありがとうございました!!
P.S.コードに(開放忘れ等の)間違いや,よりシンプルに書ける部分がありましたら 引き続きご教授お願いいたします!
|