
【已解決】批處理如何提取網頁指定內容最后由 447219071 于 -5-31 10:59因為下載的網頁http://www.bathome.net/thread-37147-1-1.html文件中有各種大量多余的代碼,如何只提取指定字符之間的內容,關鍵字符 cpulink
下載后的部分網頁如下:That's how it is 后悔來得太晚 明天 You're gone Cause that's how it is <br /><cpulink><br />http://v.qq.com/?chno=8888_139888<br />http://www.baidu.com/?1000<br />http://www.360.cn/?src=http://www.cn-boutiq.com/skin/default/image/nopic.gif />http://www.1234.com/?kq10000<br /><cpulink></td></tr></table></div>我提供的思路是WGET下載網頁后,查找CPUlink字符,如有就從這個CPUlink字符的下一行開始提取,直到遇到下一個CPUlink字符則提前一行終止截取,截取后刪除斷行符<br />還有空格符amp; 管理員提供的及二樓高手提供的出錯nclick="copycode($('code0'));">復制代碼
- @echo off
- wget http://www.bathome.net/thread-37147-1-1.html -q -O a.txt
- 提取批處理不會*******
- 最終提取上面的網頁內容,關鍵字符CPUlink,想要生成的a.txt文檔結果為
- http://v.qq.com/?chno=8888_139888
- http://www.baidu.com/?1000
- http://www.360.cn/?src=http://www.cn-boutiq.com/skin/default/image/nopic.gif>http://www.1234.com/?kq10000

