Code Coverage |
||||||||||
Lines |
Functions and Methods |
Classes and Traits |
||||||||
Total | |
0.00% |
0 / 19 |
n/a |
0 / 0 |
CRAP | n/a |
0 / 0 |
1 | <?php |
2 | |
3 | /** |
4 | * Polish (pl) stop word data for Elasticsearch analysis config. |
5 | */ |
6 | |
7 | $polishStopwords = [ |
8 | // Polish stop word list adapted from the Carrot2 project stop words list |
9 | // https://github.com/carrot2/carrot2/blob/189299c48163ae4ab79967e06fe54dcaaa2e89b1/core/carrot2-util-text/src-resources/stopwords.pl |
10 | // Distributed under the BSD License. See http://www.opensource.org/licenses/bsd-license.html |
11 | // Also see http://project.carrot2.org/license.html |
12 | |
13 | // added additional term 'o.o' because with the standard tokenizer, 'o.o.' is converted to 'o.o' |
14 | // keep the original in case a different tokenizer is ever used |
15 | 'vol', 'o.o.', 'o.o', 'mgr', 'godz', 'zł', 'www', 'pl', 'ul', 'tel', 'hab', 'prof', 'inż', |
16 | 'dr', 'i', 'u', 'aby', 'albo', 'ale', 'ani', 'aż', 'bardzo', 'bez', 'bo', 'bowiem', 'by', |
17 | 'byli', 'bym', 'był', 'była', 'było', 'były', 'być', 'będzie', 'będą', 'chce', 'choć', |
18 | 'co', 'coraz', 'coś', 'czy', 'czyli', 'często', 'dla', 'do', 'gdy', 'gdyby', 'gdyż', |
19 | 'gdzie', 'go', 'ich', 'im', 'inne', 'iż', 'ja', 'jak', 'jakie', 'jako', 'je', 'jednak', |
20 | 'jednym', 'jedynie', 'jego', 'jej', 'jest', 'jeszcze', 'jeśli', 'jeżeli', 'już', 'ją', |
21 | 'kiedy', 'kilku', 'kto', 'która', 'które', 'którego', 'której', 'który', 'których', |
22 | 'którym', 'którzy', 'lat', 'lecz', 'lub', 'ma', 'mają', 'mamy', 'mi', 'miał', 'mimo', |
23 | 'mnie', 'mogą', 'może', 'można', 'mu', 'musi', 'na', 'nad', 'nam', 'nas', 'nawet', 'nic', |
24 | 'nich', 'nie', 'niej', 'nim', 'niż', 'no', 'nowe', 'np', 'nr', 'o', 'od', 'ok', 'on', |
25 | 'one', 'oraz', 'pan', 'po', 'pod', 'ponad', 'ponieważ', 'poza', 'przed', 'przede', 'przez', |
26 | 'przy', 'raz', 'razie', 'roku', 'również', 'się', 'sobie', 'sposób', 'swoje', 'są', 'ta', |
27 | 'tak', 'takich', 'takie', 'także', 'tam', 'te', 'tego', 'tej', 'temu', 'ten', 'teraz', |
28 | 'też', 'to', 'trzeba', 'tu', 'tych', 'tylko', 'tym', 'tys', 'tzw', 'tę', 'w', 'we', 'wie', |
29 | 'więc', 'wszystko', 'wśród', 'właśnie', 'z', 'za', 'zaś', 'ze', 'że', 'żeby', 'ii', 'iii', |
30 | 'iv', 'vi', 'vii', 'viii', 'ix', 'xi', 'xii', 'xiii', 'xiv', 'xv', |
31 | ]; |
32 | |
33 | return $polishStopwords; |