我发现在文本编辑器中进行全局搜索并将单个反斜杠替换为双反斜杠是最简单的。我担心它可能会漏掉XML中的一些重要内容,因此下面的PowerShell将告诉您反斜杠周围的XML标记。
$r = Select-String \'<([^>]*)>.*?\\\\.*?\\1\' .\\wordpress.2015-09-13.xml -AllMatches
$matches = $r | % { [PSCustomObject] @{ Tag = $_.Matches.Groups[1].Value; LineNumber = $_.LineNumber; Line = $_.Line } }
$matches
在我的例子中,所有(除了一个)都是来自帖子内容本身的HTML标记。
PS> $matches | Foreach-Object Tag | Sort -Unique
/font
/SPAN
BR
content:encoded
div
font color="#000000"
FONT face="Courier New"
FONT face=Times color=#000000
LI
P
span style="color: "
span style="color: #000000"
SPAN style="COLOR: #006400"
span style="color: #cccc66; background-color: #012456"
SPAN style="COLOR: blue"
SPAN style="COLOR: green"
SPAN style="COLOR: maroon"
wp:comment_author
我看了一下wp:comment\\u作者的帖子(有人的名字中有反斜杠),他们的名字把fine引入了帖子中。