<?php /* ** converted to PHP from: % $Id: transtab.php,v 1.6 2009/04/21 13:27:06 teus Exp $ % this file has been collected by Markus Kuhn, Univesity of Cambridge (Oct 2000 V 1.8) % it is the base file for his transtab perl program % a table for transliterating ISO 10646 texts into % best-effort representations using smaller coded character sets (ASCII, % ISO 8859, etc.). $Id: transtab.php,v 1.6 2009/04/21 13:27:06 teus Exp $ */ require_once(RT."/utf8/native/core.php"); function UTF8toASCII( $string = "" ) { static $TransTab = NULL; if ( is_null($TransTab) ) { $TransTab = array( '\'' => '\’', '`' => '(‛|‘)', ' ' => ' ', '¡' => '!', '¢' => 'c', '£' => 'GBP', 'Â¥' => 'Y', '¦' => '(|)', '§' => 'S', '¨' => '"', '©' => '((c)|c)', 'ª' => 'a', '«' => '<<', '¬' => '-', 'Â' => '-', '®' => '(R)', '¯' => '-', '°' => ' ', '±' => '+/-', '²' => '(^2|2)', '³' => '(^3|3)','´' => '\'', 'µ' => 'u', '¶' => 'P', '·' => '.', '¸' => ',', '¹' => '(^1|1)', 'º' => 'o', '»' => '>>', '¼' => '1/4', '½' => '1/2', '¾' => '3/4', '¿' => '?', 'À' => 'A', 'Ã' => 'A', 'Â' => 'A', 'Ã' => 'A', 'Ä' => '(Ae|A)', 'Ã…' => '(Aa|A)', 'Æ' => '(AE|A)', 'Ç' => 'C', 'È' => 'E', 'É' => 'E', 'Ê' => 'E', 'Ë' => 'E', 'ÃŒ' => 'I', 'Ã' => 'I', 'ÃŽ' => 'I', 'Ã' => 'I', 'Ã' => 'D', 'Ñ' => 'N', 'Ã’' => 'O', 'Ó' => 'O', 'Ô' => 'O', 'Õ' => 'O', 'Ö' => '(Oe|O)','×' => 'x', 'Ø' => 'O', 'Ù' => 'U', 'Ú' => 'U', 'Û' => 'U', 'Ãœ' => '(Ue|U)','Ã' => 'Y', 'Þ' => 'Th', 'ß' => 'ss', 'à ' => 'a', 'á' => 'a', 'â' => 'a', 'ã' => 'a', 'ä' => '(ae|a)', 'Ã¥' => '(aa|a)','æ' => '(ae|a)','ç' => 'c', 'è' => 'e', 'é' => 'e', 'ê' => 'e', 'ë' => 'e', 'ì' => 'i', 'Ã' => 'i', 'î' => 'i', 'ï' => 'i', 'ð' => 'd', 'ñ' => 'n', 'ò' => 'o', 'ó' => 'o', 'ô' => 'o', 'õ' => 'o', 'ö' => '(oe|o)','÷' => ':', 'ø' => 'o', 'ù' => 'u', 'ú' => 'u', 'û' => 'u', 'ü' => '(ue|u)','ý' => 'y', 'þ' => 'th', 'ÿ' => 'y', 'Ä€' => 'A', 'Ä' => 'a', 'Ä‚' => 'A', 'ă' => 'a', 'Ä„' => 'A', 'Ä…' => 'a', 'Ć' => 'C', 'ć' => 'c', 'Ĉ' => '(Ch|C)','ĉ' => '(ch|c)','ÄŠ' => 'C', 'Ä‹' => 'c', 'ÄŒ' => 'C', 'Ä' => 'c', 'ÄŽ' => 'D', 'Ä' => 'd', 'Ä' => 'D', 'Ä‘' => 'd', 'Ä’' => 'E', 'Ä“' => 'e', 'Ä”' => 'E', 'Ä•' => 'e', 'Ä–' => 'E', 'Ä—' => 'e', 'Ę' => 'E', 'Ä™' => 'e', 'Äš' => 'E', 'Ä›' => 'e', 'Äœ' => '(Gh|G)','Ä' => '(gh|g)','Äž' => 'G', 'ÄŸ' => 'g', 'Ä ' => 'G', 'Ä¡' => 'g', 'Ä¢' => 'G', 'Ä£' => 'g', 'Ĥ' => '(Hh|H)','Ä¥' => '(hh|h)', 'Ħ' => 'H', 'ħ' => 'h', 'Ĩ' => 'I', 'Ä©' => 'i', 'Ī' => 'I', 'Ä«' => 'i', 'Ĭ' => 'I', 'Ä' => 'i', 'Ä®' => 'I', 'į' => 'i', 'Ä°' => 'I', 'ı' => 'i', 'IJ' => 'IJ', 'ij' => 'ij', 'Ä´' => '(Jh|J)', 'ĵ' => '(jh|j)','Ķ' => 'K', 'Ä·' => 'k', 'ĸ' => 'k', 'Ĺ' => 'L', 'ĺ' => 'l', 'Ä»' => 'L', 'ļ' => 'l', 'Ľ' => 'L', 'ľ' => 'l', 'Ä¿' => '(L·|L.|L)','Å€' => '(l·|l.|l)','Å' => 'L','Å‚' => 'l', 'Ń' => 'N', 'Å„' => 'n', 'Å…' => 'N', 'ņ' => 'n', 'Ň' => 'N', 'ň' => 'n', 'ʼn' => '\'n', 'ÅŠ' => '(NG|N)','Å‹' => '(ng|n)','ÅŒ' => 'O', 'Å' => 'o', 'ÅŽ' => 'O', 'Å' => 'o', 'Å' => 'O', 'Å‘' => 'o', 'Å’' => 'OE', 'Å“' => 'oe', 'Å”' => 'R', 'Å•' => 'r', 'Å–' => 'R', 'Å—' => 'r', 'Ř' => 'R', 'Å™' => 'r', 'Åš' => 'S', 'Å›' => 's', 'Åœ' => '(Sh|S)', 'Å' => '(sh|s)','Åž' => 'S', 'ÅŸ' => 's', 'Å ' => 'S', 'Å¡' => 's', 'Å¢' => 'T', 'Å£' => 't', 'Ť' => 'T', 'Å¥' => 't', 'Ŧ' => 'T', 'ŧ' => 't', 'Ũ' => 'U', 'Å©' => 'u', 'Ū' => 'U', 'Å«' => 'u', 'Ŭ' => 'U', 'Å' => 'u', 'Å®' => 'U', 'ů' => 'u', 'Å°' => 'U', 'ű' => 'u', 'Ų' => 'U', 'ų' => 'u', 'Å´' => 'W', 'ŵ' => 'w', 'Ŷ' => 'Y', 'Å·' => 'y', 'Ÿ' => 'Y', 'Ź' => 'Z', 'ź' => 'z', 'Å»' => 'Z', 'ż' => 'z', 'Ž' => 'Z', 'ž' => 'z', 'Å¿' => 's', 'Æ’' => 'f', 'Ș' => 'S', 'È™' => 's', 'Èš' => 'T', 'È›' => 't', 'ʹ' => '\'', 'Ê»' => '\'', 'ʼ' => '\'', 'ʽ' => '\'', 'ˆ' => '^', 'ˈ' => '\'', 'ˉ' => '¯', 'ËŒ' => ',', 'Ë' => ':', 'Ëš' => '°', 'Ëœ' => '~', 'Ë' => '"', 'Í´' => '\'', '͵' => ',', ';' => ';', 'Ḃ' => 'B', 'ḃ' => 'b', 'Ḋ' => 'D', 'ḋ' => 'd', 'Ḟ' => 'F', 'ḟ' => 'f', 'á¹€' => 'M', 'á¹' => 'm', 'á¹–' => 'P', 'á¹—' => 'p', 'á¹ ' => 'S', 'ṡ' => 's', 'Ṫ' => 'T', 'ṫ' => 't', 'Ẁ' => 'W', 'áº' => 'w', 'Ẃ' => 'W', 'ẃ' => 'w', 'Ẅ' => 'W', 'ẅ' => 'w', 'Ỳ' => 'Y', 'ỳ' => 'y', ' ' => ' ', 'â€' => ' ', ' ' => ' ', ' ' => ' ', ' ' => ' ', ' ' => ' ', ' ' => ' ', ' ' => ' ', ' ' => ' ', ' ' => ' ', 'â€' => '-', '‑' => '-', '‒' => '-', '–' => '-', '—' => '--', '―' => '--', '‖' => '(||)', '‗' => '_', '‘' => '\'', '’' => '\'', '‚' => '\'', '‛' => '\'', '“' => '"', 'â€' => '"', '„' => '"', '‟' => '"', '†' => '+', '‡' => '++', '•' => 'o', '‣' => '>', '․' => '.', '‥' => '..', '…' => '...', '‧' => '-', ' ' => ' ', '‰' => '0/00', '′' => '\'', '″' => '"', '‴' => '\'\'\'','‵' => '\'', '‶' => '\'\'', '‷' => '```', '‹' => '<', '›' => '>', '‼' => '!!', '‾' => '-', 'âƒ' => '-', 'â„' => '/', 'âˆ' => '?!', 'â‰' => '!?', 'âŠ' => '7', 'â°' => '(^0|0)','â´' => '(^4|4)', 'âµ' => '(^5|5)','â¶' => '(^6|6)','â·' => '(^7|7)','â¸' => '(^8|8)','â¹' => '(^9|9)', 'âº' => '(^+|+)','â»' => '(^-|-)','â¼' => '(^=|=)','â½' => '(^(|()','â¾' => '(^)|))', 'â¿' => '(^n|n)','â‚€' => '(_0|0)','â‚' => '(_1|1)','â‚‚' => '(_2|2)','₃' => '(_3|3)', 'â‚„' => '(_4|4)','â‚…' => '(_5|5)','₆' => '(_6|6)','₇' => '(_7|7)','₈' => '(_8|8)', '₉' => '(_9|9)','â‚Š' => '(_+|+)','â‚‹' => '(_-|-)','â‚Œ' => '(_=|=)','â‚' => '(_(|()', 'â‚Ž' => '(_)|))','€' => '(EUR|E)','â„€' => 'a/c', 'â„' => 'a/s', '℃' => '(°C|C)', 'â„…' => 'c/o', '℆' => 'c/u', '℉' => '(°F|F)', 'â„“' => 'l', 'â„–' => 'No', 'â„—' => '(P)', 'â„ ' => '[SM]', 'â„¡' => 'TEL', 'â„¢' => '[TM]', 'Ω' => '(ohm|O)', 'K' => 'K', 'â„«' => 'Ã…', 'â„®' => 'e', 'â…“' => '1/3', 'â…”' => '2/3', 'â…•' => '1/5', 'â…–' => '2/5', 'â…—' => '3/5', 'â…˜' => '4/5', 'â…™' => '1/6', 'â…š' => '5/6', 'â…›' => '1/8', 'â…œ' => '3/8', 'â…' => '5/8', 'â…ž' => '7/8', 'â…Ÿ' => '1/', 'â… ' => 'I', 'â…¡' => 'II', 'â…¢' => 'III', 'â…£' => 'IV', 'â…¤' => 'V', 'â…¥' => 'VI', 'â…¦' => 'VII', 'â…§' => 'VIII', 'â…¨' => 'IX', 'â…©' => 'X', 'â…ª' => 'XI', 'â…«' => 'XII', 'â…¬' => 'L', 'â…' => 'C', 'â…®' => 'D', 'â…¯' => 'M', 'â…°' => 'i', 'â…±' => 'ii', 'â…²' => 'iii', 'â…³' => 'iv', 'â…´' => 'v', 'â…µ' => 'vi', 'â…¶' => 'vii', 'â…·' => 'viii', 'â…¸' => 'ix', 'â…¹' => 'x', 'â…º' => 'xi', 'â…»' => 'xii', 'â…¼' => 'l', 'â…½' => 'c', 'â…¾' => 'd', 'â…¿' => 'm', 'â†' => '<-', '↑' => '^', '→' => '->', '↓' => 'v', '↔' => '<->', 'â‡' => '<=', '⇒' => '=>', '⇔' => '<=>', '−' => '(–|-)', '∕' => '/', //'\' => '\\', '∗' => '*', '∘' => 'o', '∙' => '·', '∞' => 'inf', '∣' => '(|)', '∥' => '(||)', '∶' => ':', '∼' => '~', '≠' => '/=', '≡' => '=', '≤' => '<=', '≥' => '>=', '≪' => '<<', '≫' => '>>', '⊕' => '(+)', '⊖' => '(-)', '⊗' => '(x)', '⊘' => '(/)', '⊢' => '(|-)', '⊣' => '(-|)', '⊦' => '(|-)', '⊧' => '(|=)', '⊨' => '(|=)', '⊩' => '(||-)', 'â‹…' => '·', '⋆' => '*', 'â‹•' => '#', '⋘' => '<<<', 'â‹™' => '>>>', '⋯' => '...', '〈' => '<', '〉' => '>', 'â€' => 'NUL', 'â' => 'SOH', 'â‚' => 'STX', 'âƒ' => 'ETX', 'â„' => 'EOT', 'â…' => 'ENQ', 'â†' => 'ACK', 'â‡' => 'BEL', 'âˆ' => 'BS', 'â‰' => 'HT', 'âŠ' => 'LF', 'â‹' => 'VT', 'âŒ' => 'FF', 'â' => 'CR', 'âŽ' => 'SO', 'â' => 'SI', 'â' => 'DLE', 'â‘' => 'DC1', 'â’' => 'DC2', 'â“' => 'DC3', 'â”' => 'DC4', 'â•' => 'NAK', 'â–' => 'SYN', 'â—' => 'ETB', 'â˜' => 'CAN', 'â™' => 'EM', 'âš' => 'SUB', 'â›' => 'ESC', 'âœ' => 'FS', 'â' => 'GS', 'âž' => 'RS', 'âŸ' => 'US', 'â ' => 'SP', 'â¡' => 'DEL', 'â£' => '_', 'â¤' => 'NL', 'â¥' => '///', 'â¦' => '?', 'â‘ ' => '((1)|1)', 'â‘¡' => '((2)|2)','â‘¢' => '((3)|3)','â‘£' => '((4)|4)','⑤' => '((5)|5)','â‘¥' => '((6)|6)', '⑦' => '((7)|7)','⑧' => '((8)|8)','⑨' => '((9)|9)','â‘©' => '(10)','⑪' => '(11)', 'â‘«' => '(12)', '⑬' => '(13)', 'â‘' => '(14)', 'â‘®' => '(15)', '⑯' => '(16)', 'â‘°' => '(17)', '⑱' => '(18)', '⑲' => '(19)', '⑳' => '(20)', 'â‘´' => '((1)|1)', '⑵' => '((2)|2)','⑶' => '((3)|3)','â‘·' => '((4)|4)','⑸' => '((5)|5)','⑹' => '((6)|6)', '⑺' => '((7)|7)','â‘»' => '((8)|8)','⑼' => '((9)|9)','⑽' => '(10)','⑾' => '(11)', 'â‘¿' => '(12)', 'â’€' => '(13)', 'â’' => '(14)', 'â’‚' => '(15)', 'â’ƒ' => '(16)', 'â’„' => '(17)', 'â’…' => '(18)', 'â’†' => '(19)', 'â’‡' => '(20)', 'â’ˆ' => '(1.|1)', 'â’‰' => '(2.|2)','â’Š' => '(3.|3)','â’‹' => '(4.|4)','â’Œ' => '(5.|5)','â’' => '(6.|6)', 'â’Ž' => '(7.|7)','â’' => '(8.|8)','â’' => '(9.|9)','â’‘' => '10.', 'â’’' => '11.', 'â’“' => '12.', 'â’”' => '13.', 'â’•' => '14.', 'â’–' => '15.', 'â’—' => '16.', 'â’˜' => '17.', 'â’™' => '18.', 'â’š' => '19.', 'â’›' => '20.', 'â’œ' => '((a)|a)', 'â’' => '((b)|b)','â’ž' => '((c)|c)','â’Ÿ' => '((d)|d)','â’ ' => '((e)|e)','â’¡' => '((f)|f)', 'â’¢' => '((g)|g)','â’£' => '((h)|h)','â’¤' => '((i)|i)','â’¥' => '((j)|j)','â’¦' => '((k)|k)', 'â’§' => '((l)|l)','â’¨' => '((m)|m)','â’©' => '((n)|n)','â’ª' => '((o)|o)','â’«' => '((p)|p)', 'â’¬' => '((q)|q)','â’' => '((r)|r)','â’®' => '((s)|s)','â’¯' => '((t)|t)','â’°' => '((u)|u)', 'â’±' => '((v)|v)','â’²' => '((w)|w)','â’³' => '((x)|x)','â’´' => '((y)|y)','â’µ' => '((z)|z)', 'â’¶' => '((A)|A)','â’·' => '((B)|B)','â’¸' => '((C)|C)','â’¹' => '((D)|D)','â’º' => '((E)|E)', 'â’»' => '((F)|F)','â’¼' => '((G)|G)','â’½' => '((H)|H)','â’¾' => '((I)|I)','â’¿' => '((J)|J)', 'â“€' => '((K)|K)','â“' => '((L)|L)','â“‚' => '((M)|M)','Ⓝ' => '((N)|N)','â“„' => '((O)|O)', 'â“…' => '((P)|P)','Ⓠ' => '((Q)|Q)','Ⓡ' => '((R)|R)','Ⓢ' => '((S)|S)','Ⓣ' => '((T)|T)', 'â“Š' => '((U)|U)','â“‹' => '((V)|V)','â“Œ' => '((W)|W)','â“' => '((X)|X)','â“Ž' => '((Y)|Y)', 'â“' => '((Z)|Z)','â“' => '((a)|a)','â“‘' => '((b)|b)','â“’' => '((c)|c)','â““' => '((d)|d)', 'â“”' => '((e)|e)','â“•' => '((f)|f)','â“–' => '((g)|g)','â“—' => '((h)|h)','ⓘ' => '((i)|i)', 'â“™' => '((j)|j)','â“š' => '((k)|k)','â“›' => '((l)|l)','â“œ' => '((m)|m)','â“' => '((n)|n)', 'â“ž' => '((o)|o)','â“Ÿ' => '((p)|p)','â“ ' => '((q)|q)','â“¡' => '((r)|r)','â“¢' => '((s)|s)', 'â“£' => '((t)|t)','ⓤ' => '((u)|u)','â“¥' => '((v)|v)','ⓦ' => '((w)|w)','ⓧ' => '((x)|x)', 'ⓨ' => '((y)|y)','â“©' => '((z)|z)','⓪' => '((0)|0)','─' => '-', 'â”' => '=', '│' => '(|)', '┃' => '(|)', '┄' => '-', 'â”…' => '=', '┆' => '(|)', '┇' => '(|)', '┈' => '-', '┉' => '=', '┊' => '(|)', '┋' => '(|)', '┌' => '+', 'â”' => '+', '┎' => '+', 'â”' => '+', 'â”' => '+', '┑' => '+', 'â”’' => '+', '┓' => '+', 'â””' => '+', '┕' => '+', 'â”–' => '+', 'â”—' => '+', '┘' => '+', 'â”™' => '+', '┚' => '+', 'â”›' => '+', '├' => '+', 'â”' => '+', '┞' => '+', '┟' => '+', 'â” ' => '+', '┡' => '+', '┢' => '+', '┣' => '+', '┤' => '+', '┥' => '+', '┦' => '+', '┧' => '+', '┨' => '+', '┩' => '+', '┪' => '+', '┫' => '+', '┬' => '+', 'â”' => '+', 'â”®' => '+', '┯' => '+', 'â”°' => '+', 'â”±' => '+', '┲' => '+', '┳' => '+', 'â”´' => '+', '┵' => '+', '┶' => '+', 'â”·' => '+', '┸' => '+', '┹' => '+', '┺' => '+', 'â”»' => '+', '┼' => '+', '┽' => '+', '┾' => '+', '┿' => '+', 'â•€' => '+', 'â•' => '+', 'â•‚' => '+', '╃' => '+', 'â•„' => '+', 'â•…' => '+', '╆' => '+', '╇' => '+', '╈' => '+', '╉' => '+', 'â•Š' => '+', 'â•‹' => '+', 'â•Œ' => '-', 'â•' => '=', 'â•Ž' => '(|)', 'â•' => '(|)', 'â•' => '=', 'â•‘' => '(|)', 'â•’' => '+', 'â•“' => '+', 'â•”' => '+', 'â••' => '+', 'â•–' => '+', 'â•—' => '+', '╘' => '+', 'â•™' => '+', 'â•š' => '+', 'â•›' => '+', 'â•œ' => '+', 'â•' => '+', 'â•ž' => '+', 'â•Ÿ' => '+', 'â• ' => '+', 'â•¡' => '+', 'â•¢' => '+', 'â•£' => '+', '╤' => '+', 'â•¥' => '+', '╦' => '+', '╧' => '+', '╨' => '+', 'â•©' => '+', '╪' => '+', 'â•«' => '+', '╬' => '+', 'â•' => '+', 'â•®' => '+', '╯' => '+', 'â•°' => '+', '╱' => '/', '╲' => '\\', '╳' => 'X', '╼' => '-', '╽' => '(|)', '╾' => '-', 'â•¿' => '(|)', 'â—‹' => 'o', 'â—¦' => 'o', '★' => '*', '☆' => '*', '☒' => 'X', '☓' => 'X', '☹' => ':-(', '☺' => ':-)', '☻' => '(-:', 'â™' => 'b', '♯' => '#', 'âœ' => '%<', '✂' => '%<', '✃' => '%<', '✄' => '%<', '✌' => 'V', '✓' => '√', '✔' => '√', '✕' => 'x', '✖' => 'x', '✗' => 'X', '✘' => 'X', '✙' => '+', '✚' => '+', '✛' => '+', '✜' => '+', 'âœ' => '+', '✞' => '+', '✟' => '+', '✠' => '+', '✡' => '*', '✢' => '+', '✣' => '+', '✤' => '+', '✥' => '+', '✦' => '+', '✧' => '+', '✩' => '*', '✪' => '*', '✫' => '*', '✬' => '*', 'âœ' => '*', '✮' => '*', '✯' => '*', '✰' => '*', '✱' => '*', '✲' => '*', '✳' => '*', '✴' => '*', '✵' => '*', '✶' => '*', '✷' => '*', '✸' => '*', '✹' => '*', '✺' => '*', '✻' => '*', '✼' => '*', '✽' => '*', '✾' => '*', '✿' => '*', 'â€' => '*', 'â' => '*', 'â‚' => '*', 'âƒ' => '*', 'â„' => '*', 'â…' => '*', 'â†' => '*', 'â‡' => '*', 'âˆ' => '*', 'â‰' => '*', 'âŠ' => '*', 'â‹' => '*', 'ff' => 'ff', 'ï¬' => 'fi', 'fl' => 'fl', 'ffi' => 'ffi', 'ffl' => 'ffl', 'ſt' => '(Å¿t|st)', 'st' => 'st', '�' => '?',); } if( $string == '' ) return "$Version$"; $len = strlen($string); $new = ""; for( $i = 0; $i < $len; $i++ ) { $try = utf8_substr($string,$i,1); if( array_key_exists($try, $TransTab ) ) { $new .= $TransTab[$try]; } else $new .= $try; } return( $new ); } //print( "Try: GüréäÖŸtje ".UTF8toASCII("converts to: GüréäÖŸtje")."\n" ); ?>