Code Coverage
 
Lines
Functions and Methods
Classes and Traits
Total
0.00% covered (danger)
0.00%
0 / 32
n/a
0 / 0
CRAP
n/a
0 / 0
1<?php
2
3/**
4 * Mirandese (mwl) data for Elasticsearch analysis config.
5 */
6
7$mirandeseStopwords = [
8    // Mirandese stop word list adapted from
9    // https://github.com/AthenaLisbonne/Mirandese/blob/master/Mirandese%20stop%20words.txt,
10    // which is in turn translated from a Portuguese stop word list.
11    // Distributed under the BSD License.
12    'de', 'a', 'la', 'l', 'que', 'quei', 'i', 'an', 'ne', 'en', 'un', 'pa', 'para',
13    'cun', 'nó', 'nan', 'nun', 'ua', 'ũa', 'ls', 'los', 'se', 'na', 'por', 'mais',
14    'más', 'las', 'cumo', 'mas', 'al', 'el', 'sou', 'sue', 'ó', 'u', 'ou', 'quando',
15    'muito', 'mui', 'mi', 'mos', 'nos', 'yá', 'you', 'tamien', 'solo', 'pul', 'pula',
16    'anté', 'até', 'esso', 'isso', 'eilha', 'antre', 'açpuis', 'adepuis', 'adespuis',
17    'apuis', 'çpuis', 'depuis', 'sien', 'sin', 'mesmo', 'miesmo', 'als', 'sous',
18    'quien', 'nas', 'me', 'mi', 'esse', 'eilhes', 'tu', 'essa', 'nun', 'nien', 'nin',
19    'sues', 'miu', 'mie', 'nua', 'nũa', 'puls', 'eilhas', 'qual', 'nós', 'le',
20    'deilhes', 'essas', 'esses', 'pulas', 'este', 'del', 'tu', 'ti', 'te', 'bós',
21    'bos', 'les', 'mius', 'mies', 'tou', 'tue', 'tous', 'tues', 'nuosso', 'nuossa',
22    'nuossos', 'nuossas', 'deilha', 'deilhas', 'esta', 'estes', 'estas', 'aquel',
23    'aqueilha', 'aqueilhes', 'aqueilhas', 'esto', 'isto', 'aqueilho', 'aquilho',
24    'stou', 'stá', 'stamos', 'stan', 'stube', 'stubo', 'stubimos', 'stubírun',
25    'staba', 'stábamos', 'stában', 'stubira', 'stubíramos', 'steia', 'stéiamos',
26    'stemos', 'stéian', 'sten', 'stubisse', 'stubíssemos', 'stubíssen', 'stubir',
27    'stubirmos', 'stubíren', 'hei', 'hai', 'há', 'hemos', 'han', 'hoube', 'houbimos',
28    'houbírun', 'houbira', 'houbíramos', 'haba', 'haia', 'hábamos', 'háiamos',
29    'hában', 'háian', 'houbisse', 'habisse', 'houbíssemos', 'habíssemos',
30    'houbíssen', 'habíssen', 'houbir', 'houbirmos', 'houbíren', 'sou', 'somos',
31    'son', 'sano', 'era', 'éramos', 'éran', 'fui', 'fui', 'fumos', 'fúrun', 'fura',
32    'fúramos', 'seia', 'séiamos', 'séian', 'fusse', 'fússemos', 'fússen', 'fur',
33    'furmos', 'fúren', 'serei', 'será', 'seremos', 'seran', 'serano', 'serie',
34    'seriemos', 'serien', 'tengo', 'ten', 'tenemos', 'ténen', 'tenie', 'teniemos',
35    'tenien', 'tube', 'tubo', 'tubimos', 'tubírun', 'tubira', 'tubíramos', 'tenga',
36    'téngamos', 'téngan', 'tubisse', 'tubíssemos', 'tubíssen', 'tubir', 'tubirmos',
37    'tubíren', 'tenerei', 'tenerá', 'teneremos', 'teneran', 'teneria', 'teneriemos',
38    'tenerien',
39    // the following words were commented out in the original Portuguese stop word
40    // list, and were also commented out in the Mirandese translation. It's not clear
41    // that they need to be skipped, so they are included here until it becomes clear
42    // they are a problem. (Our use of the plain index means these are still
43    // available for exact matching in phrases.)
44    'ye', 'fui', 'ten', 'ser', 'hai', 'há', 'stá', 'era', 'tener', 'stan', 'tenie',
45    'fúran', 'ténen', 'habie', 'seia', 'será', 'tengo', 'fusse',
46];
47
48return $mirandeseStopwords;