
[已解決]批處理如何從html格式(接收到的郵件)中讀取數據最后由 dimo 于 -12-30 19:31通過第三方批處理getmail可以獲取到郵箱里的郵件。獲取后經其自身解碼,得到一個Extract*.out文件,大致看一下其格式應該為html的寫法,并且內容只分一行。
顯然我郵件發送的原內容為:nclick="copycode($('code0'));">復制代碼
- <div dir=auto>here is the content</div>
here is the content現在要提取出其中的原內容并且將所有內容合并到一行。問題在于,郵箱不一定每次都接收到這樣簡單的文件。例如內容當中出現換行:
有時內容含特殊字符,解碼之后也無法正常顯示(某些字符):nclick="copycode($('code1'));">復制代碼
- <div dir=auto>abababababababab<br /><br />abababababababab<br /><br /></div>
i wanna get these words # $ % & * @ ? !
有時發送的內容經過復制粘貼,不小心留下了其他信息:nclick="copycode($('code2'));">復制代碼
- <div dir=auto>i wanna get these words # $ % & * @ ? !</div>
顯然需要忽略<>標簽里的所有內容才能得到原內容,并且需要還原未正常顯示的符號。可能要用到第三方了……nclick="copycode($('code3'));">復制代碼
- <div dir=auto>hey get it <span style=font-family:sans-serif>hey get it </span><br style=font-family:sans-serif /><span style=font-family:sans-serif>hey get it </span><span style=font-family:sans-serif>hey get it </span><br style=font-family:sans-serif /></div>

