Code Coverage
 
Lines
Functions and Methods
Classes and Traits
Total
0.00% covered (danger)
0.00%
0 / 49
0.00% covered (danger)
0.00%
0 / 4
CRAP
0.00% covered (danger)
0.00%
0 / 1
WordLevelDiff
0.00% covered (danger)
0.00%
0 / 48
0.00% covered (danger)
0.00%
0 / 4
380
0.00% covered (danger)
0.00%
0 / 1
 __construct
0.00% covered (danger)
0.00%
0 / 16
0.00% covered (danger)
0.00%
0 / 1
30
 split
0.00% covered (danger)
0.00%
0 / 16
0.00% covered (danger)
0.00%
0 / 1
42
 orig
0.00% covered (danger)
0.00%
0 / 8
0.00% covered (danger)
0.00%
0 / 1
20
 closing
0.00% covered (danger)
0.00%
0 / 8
0.00% covered (danger)
0.00%
0 / 1
20
1<?php
2/**
3 * Copyright © 2000, 2001 Geoffrey T. Dairiki <dairiki@dairiki.org>
4 * You may copy this code freely under the conditions of the GPL.
5 *
6 * This program is free software; you can redistribute it and/or modify
7 * it under the terms of the GNU General Public License as published by
8 * the Free Software Foundation; either version 2 of the License, or
9 * (at your option) any later version.
10 *
11 * This program is distributed in the hope that it will be useful,
12 * but WITHOUT ANY WARRANTY; without even the implied warranty of
13 * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
14 * GNU General Public License for more details.
15 *
16 * You should have received a copy of the GNU General Public License along
17 * with this program; if not, write to the Free Software Foundation, Inc.,
18 * 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.
19 * http://www.gnu.org/copyleft/gpl.html
20 *
21 * @file
22 * @ingroup DifferenceEngine
23 * @defgroup DifferenceEngine DifferenceEngine
24 */
25
26namespace Wikimedia\Diff;
27
28/**
29 * Performs a word-level diff on several lines
30 *
31 * @newable
32 * @ingroup DifferenceEngine
33 */
34class WordLevelDiff extends Diff {
35    /**
36     * @inheritDoc
37     */
38    protected $bailoutComplexity = 40_000_000; // Roughly 6K x 6K words changed
39
40    /**
41     * @stable to call
42     * @todo Don't do work in the constructor, use a service to create diffs instead (T257472).
43     *
44     * @param string[] $linesBefore
45     * @param string[] $linesAfter
46     */
47    public function __construct( $linesBefore, $linesAfter ) {
48        [ $wordsBefore, $wordsBeforeStripped ] = $this->split( $linesBefore );
49        [ $wordsAfter, $wordsAfterStripped ] = $this->split( $linesAfter );
50
51        try {
52            parent::__construct( $wordsBeforeStripped, $wordsAfterStripped );
53        } catch ( ComplexityException $ex ) {
54            // Too hard to diff, just show whole paragraph(s) as changed
55            $this->edits = [ new DiffOpChange( $linesBefore, $linesAfter ) ];
56        }
57
58        $xi = $yi = 0;
59        $editCount = count( $this->edits );
60        for ( $i = 0; $i < $editCount; $i++ ) {
61            $orig = &$this->edits[$i]->orig;
62            if ( is_array( $orig ) ) {
63                $orig = array_slice( $wordsBefore, $xi, count( $orig ) );
64                $xi += count( $orig );
65            }
66
67            $closing = &$this->edits[$i]->closing;
68            if ( is_array( $closing ) ) {
69                $closing = array_slice( $wordsAfter, $yi, count( $closing ) );
70                $yi += count( $closing );
71            }
72        }
73    }
74
75    /**
76     * @param string[] $lines
77     *
78     * @return array[]
79     */
80    private function split( $lines ) {
81        $words = [];
82        $stripped = [];
83        $first = true;
84        foreach ( $lines as $line ) {
85            if ( $first ) {
86                $first = false;
87            } else {
88                $words[] = "\n";
89                $stripped[] = "\n";
90            }
91            $m = [];
92            if ( preg_match_all( '/ ( [^\S\n]+ | [0-9_A-Za-z\x80-\xff]+ | . ) (?: (?!< \n) [^\S\n])? /xs',
93                $line, $m ) ) {
94                foreach ( $m[0] as $word ) {
95                    $words[] = $word;
96                }
97                foreach ( $m[1] as $stripped_word ) {
98                    $stripped[] = $stripped_word;
99                }
100            }
101        }
102
103        return [ $words, $stripped ];
104    }
105
106    /**
107     * @return string[]
108     */
109    public function orig() {
110        $orig = new WordAccumulator;
111
112        foreach ( $this->edits as $edit ) {
113            if ( $edit->type == 'copy' ) {
114                $orig->addWords( $edit->orig );
115            } elseif ( $edit->orig ) {
116                $orig->addWords( $edit->orig, 'del' );
117            }
118        }
119        $lines = $orig->getLines();
120
121        return $lines;
122    }
123
124    /**
125     * @return string[]
126     */
127    public function closing() {
128        $closing = new WordAccumulator;
129
130        foreach ( $this->edits as $edit ) {
131            if ( $edit->type == 'copy' ) {
132                $closing->addWords( $edit->closing );
133            } elseif ( $edit->closing ) {
134                $closing->addWords( $edit->closing, 'ins' );
135            }
136        }
137        $lines = $closing->getLines();
138
139        return $lines;
140    }
141
142}
143
144/** @deprecated class alias since 1.41 */
145class_alias( WordLevelDiff::class, 'WordLevelDiff' );