
批處理如何從html中提取出指定的幾段內容如題,該html是某在線考試系統保存得到的,其中含有160道選擇題和答案選項,想要從中將題目和答案提取出來,需要提取的包括以下幾部分內容:1、“qid”字段后的數字是題目的編號,分別是從1-160,需要提取。2、“tittle”字段后的內容是該道題的題目內容。3、“content”字段后的內容是答案選項,即A、B、C、D和文字內容。4、“answer”字段后的內容是答案,只有一個字母。現在想把這幾部分內容提取后生成為新的txt文件,這四項內容之間分別用逗號隔開(其實最終目的是放到excel里,方便在電腦本地做題或者打印出來),因html文本中符號太多,且代碼的換行也不規范,本人半桶水用for指令寫了很多條命令都沒成功,請求壇里大神指導,感謝!附件如下(已將附件替換為原始html文件):

