c# - Regular expression to filter div class content -


  & lt; div वर्ग = "सोशल मीडिया" & gt; & Lt; div id = "divLinkedin" शैली = "चौड़ाई: 100px; ऊंचाई: 0 पीएक्स;" & gt; & Lt; script src = "// platform.linkedin.com/in.js" प्रकार = "टेक्स्ट / जावास्क्रिप्ट" & gt; & lt; / script & gt; & Lt; स्क्रिप्ट डेटा-काउंटर = "सही" प्रकार = "IN / share" & gt; & lt; / स्क्रिप्ट & gt; & Lt;! - फेसबुक शेयर बटन प्रारंभ - & gt; & Lt; / div & gt; & Lt; div id = "divFb" शैली = "फ्लोट: बायां; मार्जिन-बायां: 100px;" & gt; & Lt; a expr: share_url = "डेटा: post.url" href = "http://www.facebook.com/sharer.php" नाम = "fb_share" प्रकार = "button_count" & gt; साझा करें & lt; / a & gt; & Lt; script src = "http://static.ak.fbcdn.net/connect.php/js/FB.Share" प्रकार = "टेक्स्ट / जावास्क्रिप्ट" & gt; & lt; / स्क्रिप्ट & gt; & Lt;! - फेसबुक शेयर बटन समाप्त - & gt; & Lt; / div & gt; & Lt; div id = "divTw" शैली = "फ्लोट: बाएं; मार्जिन-बाएं: 10px;" & gt; & Lt; एक वर्ग = "ट्विटर-शेयर-बटन" डेटा-लैंग = "एन" href = "https://twitter.com/share" & gt; कलरव & lt; / a & gt; & Lt; script & gt;; function (d, s, id) {var js, fjs = d.getElementsByTagName (एस) [0]; अगर (! D.getElementById (आईडी)) {js = d.createElement (s); js .id = आईडी; js.src = "https://platform.twitter.com/widgets.js"; fjs.parentNode.insertBefore (जे एस, FJS);}} (दस्तावेज़, "स्क्रिप्ट", "ट्विटर-WJS" ); & lt; / लिपि & gt; & Lt; / div & gt; & Lt; br / & gt; & Lt; br / & gt; & Lt; / div & gt;  

मुझे डिवि तत्व वर्ग = 'सोशल मीडिया' में सामग्री को फ़िल्टर करने के लिए नियमित अभिव्यक्ति खोजनी होगी। इसमें सभी सामग्री खाली स्ट्रिंग होने चाहिए? मैं ऐसा कैसे कर सकता हूं?

आप एक विश्वसनीय फैशन में RegEx के साथ HTML को पार्स नहीं कर सकते, अंत का पता लगा सकते हैं टैग सही ढंग से एक प्रमुख मुद्दा है "नियमित अभिव्यक्ति एक ऐसा उपकरण है जो एचटीएमएल द्वारा नियोजित निर्माणों को समझने के लिए अपर्याप्त परिष्कृत है। एचटीएमएल एक नियमित भाषा नहीं है और इसलिए नियमित अभिव्यक्तियों द्वारा पार्स नहीं किया जा सकता है।"

इसके बजाय उपयोग करें

उदाहरण के लिए

  एचटीएमएल दस्तावेज एचटीएमएल दस्तावेज = नया एचटीएमएल दस्तावेज (); htmlDocument.LoadHtml ( "http://www.YOURURL.com"); Foreach (HtmlNode selectNode in htmlDocument.DocumentNode.SelectNodes ("// div [@ class = 'सोशल मीडिया']")) {string divContents = selectNode.InnerText; // Do Stuff}  
पर क्लिक करें

Comments