====== Кодировка UTF-8 ====== Все данные «[[wiki:DokuWiki|Докувики]]» сейчас хранит в кодировке UTF-8. Во избежание проблем с файловой системой, имена файлов кодируются посредством [[phpfn>urlencode|URL-encoded]]. Версии «Докувики», более старые чем 2005-20-06 использовали другие кодировки, так что при обновлении данные необходимо [[wiki:tips:utf8update|перекодировать]] ([[wiki:tips:utf8update|англ.]]). Переход на другие кодировки не поддерживается. ===== Настройки браузера для UTF-8 ===== Все современные браузеры поддерживают кодировку UTF-8 — это одна из немногих вещей, которые работают в большинстве браузеров как надо. Если ваш браузер отображает некоторые символы неверно, возможно у вас отсутствуют необходимые шрифты. Пользователям Windows нужно установить шрифт ''Arialuni.TTF'', предлагаемый Микрософтом. Он включён в пакет Microsoft Office. Пользователи [[http://debian.org/|Debian]] могут узнать на [[notes>debianfonts|странице о шрифтах (англ.)]] о том, как правильно ставить юникодовые шрифты. * [[wp>Unicode and HTML]] * [[http://tlt.its.psu.edu/suggestions/international/web/unicode.html|Configuring browsers for Unicode]] ===== Редактирование файлов ===== {{ wiki:np2-bom.png|Сохранение без BOM в Notepad 2}} Если вы собираетесь править данные непосредственно или сделать [[ru:localization|перевод]], вам нужен текстовый редактор, поддерживающий UTF-8. Таких достаточно в мире, однако стоит посоветовать пару маленьких, простых и свободных на случай необходимости((Это никак не претендует ни на всеобъемлющий список редакторов с поддержкой юникода, ни на идеальный выбор. Просто **не** добавляйте сюда другие.)): * [[http://tea.linux.kiev.ua/|TEA]] --- редактор под GNU/Linux на основе GTK2. * [[http://www.flos-freeware.ch/notepad2.html|Notepad2]] --- удачная замена «блокнота» в Windows. Обратите внимание, «Докувики» //не// использует [[wp>ru:Byte_order_mark|маркер порядка байтов]] и вам необходимо убедиться, что применяемое ПО не использует его тоже (особенно, если речь идёт о правке файлов PHP или конфигурации). ===== Массовая перекодировка файлов ===== * Под Unix используйте www.gnu.org/software/libiconv/ * Под Windiws используйте recode, порт iconv: http://recode.progiciels-bpi.ca/archives * Пример простого преобразования файла: recode lat1..u8 test.txt, где ''lat1'' — кодировкая источника (замените её на свою, например koi8-r) и ''u8'' — желаемая кодировка UTF-8. * Чтобы массово перекодировать файлы под Windows, используйте эту команду (преобразующую фсе файлы в каталоге): FOR /F "tokens=*" %%G IN ('dir/b/S/X ^"C:\yourpath\*.txt^"') DO recode -v lat1..u8 %%~sG * Подробнее узнать можно [[http://jeanmarcmassou.free.fr/dokuwiki/doku.php?id=blogw:batch_on_win_for_utf_conversion|по английски там]]. ===== Примеры ===== Далее вы увидите примеры применения UTF-9 и убедиться в его правильной поддержке браузером((взято с www.eleves.ens.fr:8080/home/madore/misc/unitest/)). Знаки зодиака: ♈ ♉ ♊ ♋ ♌ ♍ ♎ ♏ ♐ ♑ ♒ ♓ Шахматная доска: ^ ^ A ^ B ^ C ^ D ^ E ^ F ^ G ^ H ^ ^ 8 | ♜ | ♞ | ♝ | ♛ | ♚ | ♝ | ♞ | ♜ | ^ 7 | ♟ | ♟ | ♟ | ♟ | ♟ | ♟ | ♟ | ♟ | ^ 6 | | | | | | | | | ^ 5 | | | | | | | | | ^ 4 | | | | | | | | | ^ 3 | | | | | | | | | ^ 2 | ♙ | ♙ | ♙ | ♙ | ♙ | ♙ | ♙ | ♙ | ^ 1 | ♖ | ♘ | ♗ | ♕ | ♔ | ♗ | ♘ | ♖ | Текст на русском: По оживлённым берегам Громады стройные теснятся Дворцов и башен; корабли Толпой со всех концов земли К богатым пристаням стремятся; На древнегреческом: Αρχαίο Πνεύμα Αθάνατον! Ἰοὺ ἰού· τὰ πάντʼ ἂν ἐξήκοι σαφῆ. Ὦ φῶς, τελευταῖόν σε προσϐλέψαιμι νῦν, ὅστις πέφασμαι φύς τʼ ἀφʼ ὧν οὐ χρῆν, ξὺν οἷς τʼ οὐ χρῆν ὁμιλῶν, οὕς τέ μʼ οὐκ ἔδει κτανών. На современном греческом: Η σύγχρονη Ελλάδα, έχει να παρουσιάσει δυναμικό έργο στον τομέα του πολιτισμού, των τεχνών και των γραμμάτων. Αντίστοιχα δυναμική είναι η παρουσία των Ελλήνων επιχειρηματιών στην διεθνή οικονομική και βιομηχανική σκηνή. На санскрите: पशुपतिरपि तान्यहानि कृच्छ्राद् अगमयदद्रिसुतासमागमोत्कः । कमपरमवशं न विप्रकुर्युर् विभुमपि तं यदमी स्पृशन्ति भावाः ॥ На хинди: गूगल समाचार हिन्दी में На корейском: 한글은 아름다운 우리글입니다. 곱고 아름답게 사용하는 것이 우리의 의무입니다. На китайском: 子曰:「學而時習之,不亦說乎?有朋自遠方來,不亦樂乎? 人不知而不慍,不亦君子乎?」 有子曰:「其為人也孝弟,而好犯上者,鮮矣; 不好犯上,而好作亂者,未之有也。君子務本,本立而道生。 孝弟也者,其為仁之本與!」 На японском: 「秋の田の かりほの庵の 苫をあらみ わが衣手は 露にぬれつつ」 天智天皇 「春すぎて 夏来にけらし 白妙の 衣ほすてふ 天の香具山」 持統天皇 「あしびきの 山鳥の尾の しだり尾の ながながし夜を ひとりかも寝む」 柿本人麻呂 На латвийском: Iedomu jaukie ideāli, Vecākie principi, tikla, mīla - Dienas allažības priekšā Šķīst kā graudi akmeņstarpā. Glāžšķūņa rūķīši jautri dziedādami čiepj koncertflīģeļa vāku. Упрощённым китайским письмом: 这是简体字汉语。 zhè shì jiǎn t zì hàn yǔ На армянском: Հարգանքներիս հավաստիքը Հայ Ժողովրդին: Ամենալավ օրենքները չեն օգնի, եթե մարդիկ բանի պետք չեն: На иврите: המשפט עם הזכוכית שאפשר לאכול בלי שזה מפריע, לא זוכר איך הוא הולך