Toggle menu
Toggle preferences menu
Toggle personal menu
Not logged in
Your IP address will be publicly visible if you make any edits.

Module:Multilingual description/sort

From Zenniverse Media
Revision as of 04:59, 31 July 2025 by Zen (talk | contribs) (Created page with "--[=[ The documented sort order is by script, then alphabetically by displayed native name (as generated by {{#language: code}}), using the default DUCET order. This allows easier selection by users reading the lists of languages in order to find their own. Please test this order, and maintain it as complete as possible, including legacy codes still used in MediaWiki. Any missing language will be sorted after all languages listed below, just using its internal la...")
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Documentation for this module may be created at Module:Multilingual description/sort/doc

--[=[
  The documented sort order is by script, then alphabetically by displayed native name (as generated by {{#language: code}}), using the default DUCET order.
  This allows easier selection by users reading the lists of languages in order to find their own.
  Please test this order, and maintain it as complete as possible, including legacy codes still used in MediaWiki.
  Any missing language will be sorted after all languages listed below, just using its internal language code.
]=]
local p = {
-- LTR scripts
  -- Latin alphabets
    --[=[A]=] 'sma', 'ace', 'ang', 'af', 'agq', 'ak', 'gsw', 'als', 'en-us', 'ase', 'smn', 'an', 'aae', 'rup', 'roa-rup', 'frp', 'ast', 'atj', 'gn', 'ay', 'az',
    --[=[B]=] 'ksf', 'bfd', 'abs', 'gor', 'id', 'ms', 'bdr', 'bkc', 'bkh', 'bm', 'bax', 'zh-min-nan', 'nan-latn-pehoeji', 'nan-latn-tailo', 'bjn', 'ban', 'jv-x-bms', 'map-bms', 'bug', 'bug-latn', 'bas', 'mui', 'btm', 'bbc', 'bbc-latn', 'zag', 'zag-latn', 'bew', 'sje', 'bcl', 'bi', 'bar', 'bs', 'brh', 'br', 'en-gb',
    --[=[C]=] 'en-ca', 'cps', 'cal', 'ca', 'ceb', 'cs', 'cho', 'ch', 'cbk-zam', 'ny', 'chn', 'sn', 'tum', 'lua', 'sei', 'co', 'cy',
    --[=[D]=] 'dga', 'dag', 'da', 'se', 'se-no', 'se-se', 'se-fi', 'pdc', 'de', 'de-formal', 'de-latf', 'nv', 'dsb', 'non'--[=[Dǫnsk tunga]=], 'na', 'dua',
    --[=[E]=] 'mh', 'et', 'efi', 'etu', 'vmw', 'egl', 'eml', 'en', 'es', 'es-formal', 'es-419', 'eo', 'ext', 'eto', 'eu', 'ee', 'ewo',
    --[=[F]=] 'wls', 'gur', 'fmp', 'hif', 'hif-latn', 'fil', 'fon', 'fo', 'fr', 'frc', 'fy', 'ff', 'fur',
    --[=[G]=] 'gaa', 'ga', 'gv', 'sm', 'gag', 'gd', 'gl', 'gya', 'aln', 'gpe', 'bbj', 'ki', 'gom-latn', 'guw', 'hak-latn',
    --[=[H]=] 'cnh', 'ha', 'ha-latn', 'haw', 'ho', 'hmn', 'hsb', 'hr', 'hrx',
    --[=[I]=] 'ibb', 'io', 'igl', 'ig', 'rw', 'rn', 'ilo', 'hil', 'ia', 'ie', 'ike-latn', 'ik', 'bto', 'nr', 'xh', 'zu', 'is', 'isu', 'it',
    --[=[J]=] 'iba', 'jv', 'smj', 'jut',
    --[=[K]=] 'rmf', 'kbp', 'kea', 'dtp', 'kl', 'kr', 'pam', 'cak', 'kai', 'krl', 'csb', 'ker', 'kw', 'hke', 'krj', 'kiu', 'sw', 'bkm', 'kg', 'avk', 'ses', 'ht', 'gcf'--[=[kréyòl gwadloupéyen]=], 'kri', 'gcr', 'kge', 'ku', 'ku-latn', 'kmr', 'kmr-latn', 'kus', 'fkv', 'kj', 'nmg', 'acf',
    --[=[L]=] 'jbo', 'lld', 'lad', 'lns', 'ljp', 'ltg', 'la', 'lv', 'lzz', 'to', 'lb', 'nia', 'lt', 'lij', 'li', 'ln', 'lfn', 'liv', 'olo', 'lmo', 'lg',
    --[=[M]=] 'mad', 'hu', 'hu-formal', 'vmf', 'mcp', 'mak', 'mg', 'mt', 'mnc', 'mnc-latn', 'mi', 'arn', 'mrh', 'srq', 'fit', 'byv', 'isv-latn', 'fat', 'min', 'cdo-latn', 'mwl', 'lus', 'bqz', 'mos', 'mua', 'mus',
    --[=[N]=] 'fj', 'nah', 'pcm', 'nap', --[=['nrm', should be Narom]=] 'nmz', 'nnz', 'nl', 'nl-informal', 'nds-nl', 'cr', 'nge', 'nnh', 'nla', 'yrl', 'niu', 'lem', 'frr', 'pih', 'no', 'nb', 'nn', 'nrf'--[=[Nouormand]=], 'nrm'--[=[currently Nouormand, should be Narom instead]=], 'nov', 'yas', 'sms', 'nup', 'nys',
    --[=[O]=] 'uz-latn', 'uz', 'ann', 'oc', 'ojb', 'om', 'nyo', 'ttj', 'ng', 'de-at', 'hz',
    --[=[P]=] 'pfl', 'pag', 'ami', 'pap-aw', 'pap', 'jam', 'pcd', 'wes', 'pms', 'pwn', 'nds', 'pdt', 'cpx-latn', 'pl', 'fvr', 'pt', 'pt-br', 'prg', 'cmn-pinyin',
    --[=[Q]=] 'aa', 'kaa', 'quc', 'kk-latn', 'kk-tr', 'crh', 'crh-latn',
    --[=[R]=] 'ty', 'ksh', 'ro', 'rmc', 'rmy', 'rgn', 'rm', 'qug', 'qu', 'nyn',
    --[=[S]=] 'xsy', 'szy', 'sg', 'sc', 'sro', 'sdc', 'sli', 'de-ch', 'sco', 'trv', 'stq', 'st', 'nso', 'tn', 'sq', 'scn', 'loz', 'simple', 'ss', 'sk', 'sl', 'szl', 'so', 'srn', 'sr-latn', 'sr-el', 'sh'--[=[latn/cyrl]=], 'sh-latn', 'sh-el', 'su', 'fi', 'sv',
    --[=[T]=] 'shy', 'shy-latn', 'shi', 'shi-latn', 'tl', 'tzl', 'zgh-latn', 'tpv', 'kab', 'scn-x-tara', 'roa-tara', 'rif', 'tt-latn', 'crh-ro', 'tay', 'tet', 'din', 'vi', 'tg-latn', 'tpi', 'tok', 'tly', 'chy', 've', 'bag', 'tvu', 'aeb-latn', 'tr', 'tk', 'tru', 'tw', 'kcg',
    --[=[U]=] 'sju', 'ug-latn',
    --[=[V]=] 'vot', 'za', 'vec', 'vep', 'ruq', 'ruq-latn', 'vo', 'vro', 'fiu-vro', 'mcn', 'vut',
    --[=[W]=] 'wlx', 'wa', 'bci', 'guc', 'osa-latn', 'vls', 'wal', 'war', 'wo', 'wya',
    --[=[X]=] 'ts',
    --[=[Y]=] 'yat', 'yav', 'ybb', 'knc', 'yo',
    --[=[Z]=] 'diq', 'zea', 'sgs', 'bat-smg', 'zh-pinyin',
  -- Greek and Coptic alphabets
    'grc', 'el', 'pnt',
    'cop',
  -- Cyrillic alphabets
    --[=[А]=] 'av', 'ady', 'ady-cyrl', 'kbd', 'kbd-cyrl', 'alt', 'ab',
    --[=[Б]=] 'ba', 'be', 'be-tarask', 'be-x-old', 'bxr', 'bg',
    --[=[В]=] 'ruq-cyrl',
    --[=[Г]=] 'inh',
    --[=[И]=] 'os',
    --[=[К]=] 'sjd', 'kv', 'krc', 'kum', 'crh-cyrl', 'ky', 'mrj', 'kk', 'kk-cyrl', 'kk-kz',
    --[=[Л]=] 'lbe', 'lez',
    --[=[М]=] 'mk', 'isv-cyrl', 'mdf', 'mo', 'mn', 'rut',
    --[=[Н]=] 'gld', 'nog', 'ce',
    --[=[О]=] 'mhr',
    --[=[П]=] 'koi',
    --[=[Р]=] 'rue', 'rsk', 'ru',
    --[=[C]=] 'sah', 'sty', 'cu', 'sr-cyrl', 'sr-ec', 'sr'--[=[cyrl/latn]=], 'sh-cyrl', 'sh-ec',
    --[=[Т]=] 'tt-cyrl', 'tt', 'tly-cyrl', 'tg-cyrl', 'tg', 'tyv',
    --[=[У]=] 'udm', 'uz-cyrl', 'uk',
    --[=[Х]=] 'kjh', 'xal',
    --[=[Ч]=] 'cv',
    --[=[Э]=] 'myv',
  -- Other alphabets (horizontal only)
    'xmf', 'ka',
    'hyw', 'hy',
    'zag-berf',
    'hoc',
  -- Devanagari abugidas
    'anp', 'awa', 'xnr-deva', 'xnr', 'thq', 'ks-deva', 'ks', 'gju-deva', 'kgg', 'gom-deva', 'gom', 'dgo-deva', 'dgo', 'doi-deva', 'doi', 'dty', 'new', 'ne', 'pi', 'bho', 'bh', 'mag', 'mr', 'rwr', 'mai', 'sa', 'bgc', 'hi',
  -- Bengali abugidas
    'as', 'rkt', 'bn', 'bpy',
  -- Other North Indian abugidas
    'pa',
    'syl',
    'xnr-takr', 'doi-takr', 'dgo-takr',
  -- South Indian abugidas
    'gu',
    'or', 'dso', 'bfw',
    'ta',
    'nit', 'te',
    'kn', 'tcy',
    'ml',
    'si',
  -- Tibeto-Burmese abugidas
    'dz', 'bo', 'lep-tibt',
    'lep', 'lep-lepc',
    'mni',
    'ksw', 'blk', 'kjp', 'shn', 'mnw', 'my', 'rki',
  -- Other Central and South-Eastern Asian abugidas
    'ccp',
    'km',
    'lo',
    'tdd',
    'nod',
    'th',
    'bug-bugi',
    'ban-bali',
    'sat',
  -- North-Western syllabaries
    'chr',
    'ike-cans', 'iu',
    'got',
  -- African syllabaries
    'tzm', 'zgh', 'shi-tfng', 'rif-tfng', 'sjs',
    'tig', 'ti', 'am',
  -- Asian syllabaries
    'ii',
  -- Korean scripts (alphabet and sinograms)
    'ko-kp', 'ko', 'ko-kr',
  -- Japanese scripts (syllabaries and sinograms)
    'ja', 'ryu',
  -- Sinographic scripts (plus Bopomofo syllabary)
    'zh', 'zh-cn', 'zh-sg', 'zh-mo', 'zh-hans', 'zh-hant', 'zh-tw', 'zh-hk', 'zh-my',
    'cmn', 'cmn-hans', 'cmn-hant',
    'wuu-hant', 'wuu', 'wuu-hans',
    'hak', 'hak-hant', 'hak-hans',
    'lzh', 'zh-classical',
    'hsn',
    'yue', 'zh-yue', 'yue-hant', 'yue-hans',
    'cpx', 'cpx-hant', 'cpx-hans',
    'gan', 'gan-hant', 'gan-hans', 'nan-hani', 'nan', 'nan-hant', 'cdo', 'cdo-hant',
-- Other vertical scripts (that are rendered horizontally, when not rotated explicitly by style)
    'mnc-mong',
-- RTL scripts
  -- Hebrew abjads
    'yi', 'ydd', 'yih', 'he', 'hbo',
  -- Arabic abjads
    --[=[ء]=] -- [=[ٴ]=]
    --[=[ئ]=] 'ug-arab', 'ug',
    --[=[ا]=] 'ur', 'ary', 'ar', 'acq', 'uz-arab',
      --[=[أ]=] --[=[ٱ]=] --[=[ٳ]=] --[=[ٲ]=] --[=[ا]=] --[=[آ]=]
    --[=[ب]=] 'bqi', 'bsk', 'bgp' ,'bal', 'ms-arab',
      --[=[ب]=] --[=[ٻ]=] --[=[ڀ]=]
      --[=[پ]=] 'ps', 'pnb',
      --[=[ت]=] 'aeb-arab', 'aeb', 'azb',
      --[=[ٺ]=] --[=[ٿ]=] --[=[ټ]=] --[=[ٽ]=] --[=[ٹ]=]
    --[=[ج]=] 'arq', 'bcc',
      --[=[ڃ]=] --[=[ڄ]=] --[=[چ]=] --[=[ڇ]=] --[=[ح]=] --[=[ځ]=] --[=[ڂ]=] --[=[څ]=] --[=[خ]=]
    --[=[د]=] --[=[ڋ]=] --[=[ڈ]=] --[=[ډ]=] --[=[ڊ]=] --[=[ڍ]=] --[=[ڎ]=] --[=[ڏ]=] --[=[ڐ]=] --[=[ذ]=] --[=[ڌ]=]
    --[=[ر]=] 'bgn',
      --[=[ڕ]=] --[=[ڒ]=] --[=[ڔ]=] --[=[ږ]=] --[=[ڗ]=] --[=[ڑ]=] --[=[ړ]=] --[=[ز]=] --[=[ڙ]=] --[=[ژ]=]
    --[=[س]=] 'skr', 'skr-arab', 'sd',
      --[=[ڛ]=] --[=[ښ]=] --[=[ڜ]=]
      --[=[ش]=] 'apc', 'acm', 'ajp',
    --[=[ص]=] --[=[ڝ]=] --[=[ڞ]=] --[=[ض]=]
    --[=[ط]=] --[=[ڟ]=] --[=[ظ]=]
    --[=[ع]=] 'arb',
      --[=[ڠ]=] --[=[غ]=]
    --[=[ڡ]=]
      --[=[ف]=] 'fa-af', 'fa', 'prd',
      --[=[ڢ]=] --[=[ڣ]=] --[=[ڤ]=] --[=[ڥ]=] --[=[ڦ]=]
    --[=[ق]=] 'kk-arab', 'kk-cn',
      --[=[ڧ]=] --[=[ڨ]=]
    --[=[ك]=] 'ku-arab', 'kcn', 'kmr-arab',
      --[=[ګ]=] --[=[ڮ]=] --[=[ڬ]=] --[=[ڭ]=]
      --[=[ک]=] 'ks-arab', 'pbt', 'khw', 'ckb', 'sdh',
      --[=[ڪ]=]
      --[=[گ]=] 'gju-arab', 'glk',
      --[=[ڰ]=] --[=[ڱ]=] --[=[ڳ]=] --[=[ڲ]=] --[=[ڴ]=]
    --[=[ل]=] 'ota', 'lrc', 'luz', 'lki',
      --[=[ڵ]=] --[=[ڶ]=] --[=[ڷ]=]
    --[=[م]=] 'mve', 'mzn', 'arz', 'pst',
    --[=[ں]=] --[=[ن]=] --[=[ڼ]=] --[=[ڻ]=] --[=[ڽ]=]
    --[=[ۃ]=]
      --[=[ه]=] 'ha-arab',
      --[=[ہ]=] 'hno',
      --[=[ھ]=] --[=[ۂ]=] --[=[ە]=] --[=[ۀ]=]
    --[=[و]=] 'wne',
      --[=[ۄ]=] --[=[ۆ]=] --[=[ۅ]=] --[=[ۇ]=] --[=[ۈ]=] --[=[ۉ]=]
    --[=[ې]=] --[=[ۍ]=] --[=[ى]=] --[=[ي]=] --[=[ێ]=] --[=[ۑ]=] --[=[ے]=]
      --[=[ی]=] 'pbu',
      --[=[ۓ]=]
  -- Other semitics abjads
    'arc', 'syc',
    'dv',
    'nqo',
    'phn', 'xpu',
-- Additional language codes that still need to be sorted by native name can be temporarily placed here
}

setmetatable(p, {
    quickTests = function()
        local s = {}
        for k, lang in pairs(p) do
            if type(k) ~= 'number' or k < 1 or k ~= math.floor(k)
            or type(lang) ~= 'string' or #lang < 2 or #lang > 16
            or (lang):find('^[a-z][%-0-9a-z]*[0-9a-z]$') ~= 1
            or s[lang] then
                return false, ': invalid sequence of distinct lowercase language codes at p[' .. tostring(k) .. '] = "' .. tostring(lang) .. '"'
            end
            s[lang] = true
        end
        return true
    end
})
--[=[ To test this module in the Lua console: -- must return true
=getmetatable(p).quickTests()
--]=]

return p