Code Coverage |
||||||||||
Lines |
Functions and Methods |
Classes and Traits |
||||||||
Total | |
0.00% |
0 / 32 |
n/a |
0 / 0 |
CRAP | n/a |
0 / 0 |
1 | <?php |
2 | |
3 | /** |
4 | * Mirandese (mwl) data for Elasticsearch analysis config. |
5 | */ |
6 | |
7 | $mirandeseStopwords = [ |
8 | // Mirandese stop word list adapted from |
9 | // https://github.com/AthenaLisbonne/Mirandese/blob/master/Mirandese%20stop%20words.txt, |
10 | // which is in turn translated from a Portuguese stop word list. |
11 | // Distributed under the BSD License. |
12 | 'de', 'a', 'la', 'l', 'que', 'quei', 'i', 'an', 'ne', 'en', 'un', 'pa', 'para', |
13 | 'cun', 'nó', 'nan', 'nun', 'ua', 'ũa', 'ls', 'los', 'se', 'na', 'por', 'mais', |
14 | 'más', 'las', 'cumo', 'mas', 'al', 'el', 'sou', 'sue', 'ó', 'u', 'ou', 'quando', |
15 | 'muito', 'mui', 'mi', 'mos', 'nos', 'yá', 'you', 'tamien', 'solo', 'pul', 'pula', |
16 | 'anté', 'até', 'esso', 'isso', 'eilha', 'antre', 'açpuis', 'adepuis', 'adespuis', |
17 | 'apuis', 'çpuis', 'depuis', 'sien', 'sin', 'mesmo', 'miesmo', 'als', 'sous', |
18 | 'quien', 'nas', 'me', 'mi', 'esse', 'eilhes', 'tu', 'essa', 'nun', 'nien', 'nin', |
19 | 'sues', 'miu', 'mie', 'nua', 'nũa', 'puls', 'eilhas', 'qual', 'nós', 'le', |
20 | 'deilhes', 'essas', 'esses', 'pulas', 'este', 'del', 'tu', 'ti', 'te', 'bós', |
21 | 'bos', 'les', 'mius', 'mies', 'tou', 'tue', 'tous', 'tues', 'nuosso', 'nuossa', |
22 | 'nuossos', 'nuossas', 'deilha', 'deilhas', 'esta', 'estes', 'estas', 'aquel', |
23 | 'aqueilha', 'aqueilhes', 'aqueilhas', 'esto', 'isto', 'aqueilho', 'aquilho', |
24 | 'stou', 'stá', 'stamos', 'stan', 'stube', 'stubo', 'stubimos', 'stubírun', |
25 | 'staba', 'stábamos', 'stában', 'stubira', 'stubíramos', 'steia', 'stéiamos', |
26 | 'stemos', 'stéian', 'sten', 'stubisse', 'stubíssemos', 'stubíssen', 'stubir', |
27 | 'stubirmos', 'stubíren', 'hei', 'hai', 'há', 'hemos', 'han', 'hoube', 'houbimos', |
28 | 'houbírun', 'houbira', 'houbíramos', 'haba', 'haia', 'hábamos', 'háiamos', |
29 | 'hában', 'háian', 'houbisse', 'habisse', 'houbíssemos', 'habíssemos', |
30 | 'houbíssen', 'habíssen', 'houbir', 'houbirmos', 'houbíren', 'sou', 'somos', |
31 | 'son', 'sano', 'era', 'éramos', 'éran', 'fui', 'fui', 'fumos', 'fúrun', 'fura', |
32 | 'fúramos', 'seia', 'séiamos', 'séian', 'fusse', 'fússemos', 'fússen', 'fur', |
33 | 'furmos', 'fúren', 'serei', 'será', 'seremos', 'seran', 'serano', 'serie', |
34 | 'seriemos', 'serien', 'tengo', 'ten', 'tenemos', 'ténen', 'tenie', 'teniemos', |
35 | 'tenien', 'tube', 'tubo', 'tubimos', 'tubírun', 'tubira', 'tubíramos', 'tenga', |
36 | 'téngamos', 'téngan', 'tubisse', 'tubíssemos', 'tubíssen', 'tubir', 'tubirmos', |
37 | 'tubíren', 'tenerei', 'tenerá', 'teneremos', 'teneran', 'teneria', 'teneriemos', |
38 | 'tenerien', |
39 | // the following words were commented out in the original Portuguese stop word |
40 | // list, and were also commented out in the Mirandese translation. It's not clear |
41 | // that they need to be skipped, so they are included here until it becomes clear |
42 | // they are a problem. (Our use of the plain index means these are still |
43 | // available for exact matching in phrases.) |
44 | 'ye', 'fui', 'ten', 'ser', 'hai', 'há', 'stá', 'era', 'tener', 'stan', 'tenie', |
45 | 'fúran', 'ténen', 'habie', 'seia', 'será', 'tengo', 'fusse', |
46 | ]; |
47 | |
48 | return $mirandeseStopwords; |