本文介绍如何使用 php 将含竖线(`|`)分隔的 xm

在实际 XML 数据处理中,常遇到“伪复合字段”——即单个 XML 元素内用分隔符(如 |、,)拼接多个值。例如:
https://example.com/1.jpg|https://example.com/2.jpg|https://example.com/3.jpg
目标是将其规范化为语义清晰、符合 XML 标准的嵌套结构:
https://example.com/1.jpg https://example.com/2.jpg https://example.com/3.jpg
为此,我们设计一个高内聚、低耦合的函数 split_images(),它仅接收纯文本内容(即 $value),不依赖原始 XML 标签字符串,从而提升可测试性与复用性:
function split_images($value, $baseTag = 'Image', $parentTag = 'ImageURL') {
if (empty(trim($value))) {
return "<{$parentTag}>{$parentTag}>";
}
$urls = array_filter(array_map('trim', explode('|', $value)));
$result = "<{$parentTag}>\n";
foreach ($urls as $index => $url) {
$childTag = $baseTag . ($index + 1);
$result .= " <{$childTag}>" . htmlspecialchars($url, ENT_XML1, 'UTF-8') . "{$childTag}>\n";
}
$result .= "{$parentTag}>";
return $result;
}
// 使用示例
$rawUrls = 'https://example.com/example.jpg|https://example.com/example2.jpg';
echo split_images($rawUrls);✅ 输出效果:
https://example.com/example.jpg https://example.com/example2.jpg
⚠️ 注意事项:
该方案简洁、安全、可扩展,是 XML 内容规范化处理的典型实践。