PHP에서 두 문자열의 차이점을 강조
PHP에서 두 문자열의 차이점을 강조 표시하는 가장 쉬운 방법은 무엇입니까?
새 텍스트가 녹색이고 제거 된 텍스트가 빨간색 인 스택 오버플로 편집 기록 페이지의 줄을 따라 생각하고 있습니다. 미리 작성된 함수 나 클래스가 있으면 이상적입니다.
PHP Horde_Text_Diff를 사용할 수 있습니다 패키지를 . 그것은 당신의 요구에 적합하며, 꽤 커스터마이징이 가능합니다.
또한 GPL에 따라 라이센스가 부여되어 있으므로 즐기십시오!
하나의 문자열을 다른 문자열로 변환하기 위해 가장 적은 수의 편집을 계산하기 위해 클래스를 작성했습니다.
diff의 HTML 버전을 렌더링하는 정적 함수가 있습니다.
그것은 첫 번째 버전이며 개선 될 가능성이 있지만 지금은 잘 작동하므로 누군가가 필요로하는 것처럼 컴팩트 한 diff를 효율적으로 생성 해야하는 경우에 대비하여 버리고 있습니다.
편집 : 그것은 지금 Github에 있습니다 :
강력한 라이브러리를 원한다면 Text_Diff (PEAR 패키지)가 꽤 좋아 보입니다. 꽤 멋진 기능이 있습니다.
이것은 또한 좋은 것입니다,
문제를 해결하는 것은 생각만큼 간단하지 않으며 문제를 파악하기 전에 약 1 년 동안 문제가 발생했습니다. 18 줄의 코드로 PHP로 알고리즘을 작성할 수있었습니다. diff를 수행하는 가장 효율적인 방법은 아니지만 이해하기 가장 쉬운 방법 일 것입니다.
두 문자열에 공통적 인 가장 긴 단어 시퀀스를 찾고 하위 문자열에 공통된 단어가 없을 때까지 나머지 문자열의 가장 긴 시퀀스를 재귀 적으로 찾습니다. 이 시점에서 나머지 새 단어를 삽입으로, 나머지 오래된 단어를 삭제로 추가합니다.
여기에서 소스를 다운로드 할 수 있습니다 : PHP SimpleDiff ...
다음은 두 배열을 비교하는 데 사용할 수있는 간단한 기능입니다. LCS 알고리즘을 구현합니다 .
function computeDiff($from, $to)
$diffValues = array();
$diffMask = array();
$dm = array();
$n1 = count($from);
$n2 = count($to);
for ($j = -1; $j < $n2; $j++) $dm[-1][$j] = 0;
for ($i = -1; $i < $n1; $i++) $dm[$i][-1] = 0;
for ($i = 0; $i < $n1; $i++)
for ($j = 0; $j < $n2; $j++)
if ($from[$i] == $to[$j])
$ad = $dm[$i - 1][$j - 1];
$dm[$i][$j] = $ad + 1;
$a1 = $dm[$i - 1][$j];
$a2 = $dm[$i][$j - 1];
$dm[$i][$j] = max($a1, $a2);
$i = $n1 - 1;
$j = $n2 - 1;
while (($i > -1) || ($j > -1))
if ($j > -1)
if ($dm[$i][$j - 1] == $dm[$i][$j])
$diffValues[] = $to[$j];
$diffMask[] = 1;
if ($i > -1)
if ($dm[$i - 1][$j] == $dm[$i][$j])
$diffValues[] = $from[$i];
$diffMask[] = -1;
$diffValues[] = $from[$i];
$diffMask[] = 0;
$diffValues = array_reverse($diffValues);
$diffMask = array_reverse($diffMask);
return array('values' => $diffValues, 'mask' => $diffMask);
두 개의 배열을 생성합니다.
- values 배열 : diff에 나타나는 요소 목록.
- 마스크 배열 : 숫자를 포함합니다. 0 : 변경되지 않음, -1 : 제거됨, 1 : 추가됨.
배열을 문자로 채우면 인라인 차이를 계산하는 데 사용할 수 있습니다. 이제 차이점을 강조하기위한 단 한 단계 만 수행하십시오.
function diffline($line1, $line2)
$diff = computeDiff(str_split($line1), str_split($line2));
$diffval = $diff['values'];
$diffmask = $diff['mask'];
$n = count($diffval);
$pmc = 0;
$result = '';
for ($i = 0; $i < $n; $i++)
$mc = $diffmask[$i];
if ($mc != $pmc)
switch ($pmc)
case -1: $result .= '</del>'; break;
case 1: $result .= '</ins>'; break;
switch ($mc)
case -1: $result .= '<del>'; break;
case 1: $result .= '<ins>'; break;
$result .= $diffval[$i];
$pmc = $mc;
switch ($pmc)
case -1: $result .= '</del>'; break;
case 1: $result .= '</ins>'; break;
return $result;
예 :
echo diffline('StackOverflow', 'ServerFault')
출력합니다 :
추가 사항 :
- The diff matrix requires (m+1)*(n+1) elements. So you can run into out of memory errors if you try to diff long sequences. In this case diff larger chunks (eg. lines) first, then diff their contents in a second pass.
- The algorithm can be improved if you trim the matching elements from the beginning and the end, then run the algorithm on the differing middle only. A latter (more bloated) version contains these modifications too.
There is also a PECL extension for xdiff:
In particular:
- xdiff_string_diff — Make unified diff of two strings
Example from PHP Manual:
$old_article = file_get_contents('./old_article.txt');
$new_article = $_POST['article'];
$diff = xdiff_string_diff($old_article, $new_article, 1);
if (is_string($diff)) {
echo "Differences between two articles:\n";
echo $diff;
I had terrible trouble with the both the PEAR-based and the simpler alternatives shown. So here's a solution that leverages the Unix diff command (obviously, you have to be on a Unix system or have a working Windows diff command for it to work). Choose your favourite temporary directory, and change the exceptions to return codes if you prefer.
* @brief Find the difference between two strings, lines assumed to be separated by "\n|
* @param $new string The new string
* @param $old string The old string
* @return string Human-readable output as produced by the Unix diff command,
* or "No changes" if the strings are the same.
* @throws Exception
public static function diff($new, $old) {
$tempdir = '/var/somewhere/tmp'; // Your favourite temporary directory
$oldfile = tempnam($tempdir,'OLD');
$newfile = tempnam($tempdir,'NEW');
if (!@file_put_contents($oldfile,$old)) {
throw new Exception('diff failed to write temporary file: ' .
if (!@file_put_contents($newfile,$new)) {
throw new Exception('diff failed to write temporary file: ' .
$answer = array();
$cmd = "diff $newfile $oldfile";
exec($cmd, $answer, $retcode);
if ($retcode != 1) {
throw new Exception('diff failed with return code ' . $retcode);
if (empty($answer)) {
return 'No changes';
} else {
return implode("\n", $answer);
This is the best one I've found.
What you are looking for is a "diff algorithm". A quick google search led me to this solution. I did not test it, but maybe it will do what you need.
A php port of Neil Frasers diff_match_patch (Apache 2.0 licensed)
I would recommend looking at these awesome functions from PHP core:
similar_text — Calculate the similarity between two strings
levenshtein — Calculate Levenshtein distance between two strings
soundex — Calculate the soundex key of a string
metaphone — Calculate the metaphone key of a string
I came across this PHP diff class by Chris Boulton based on Python difflib which could be a good solution:
