Какой рейтинг вас больше интересует?
|
Главная / Главные темы / Тэг «unicode»
«Й» вам не «и» краткое! О важности нормализации Unicode 2015-07-15 20:38:14
... текст в представлении Unicode. Одна графема может ...
+ развернуть текст сохранённая копия
За последние полгода интернет просто наводнила «буква» «й». Я встречал ее на новостных сайтах, в мессенджерах, на хабрахабре и geektimes. «О чем вообще речь?» — спросите вы — «Я вижу обычную букву й!». Вам повезло. Я вижу ее так:
Если вы из тех счастливчиков, у кого буква «й» выглядит так же, как и «настоящая» «й», вот вам фокус: скопируйте ее (букву «й») в блокнот, поставьте курсор в конец буквы и нажмите backspace. Магия, отвал башки просто!
Как же так получается?
Графемы, глифы, code points, компоновка и байтыОчень краткое введение:
Графема — то, что мы привыкли называть буквой в смысле единицы текста. Глиф является единицей графики, и может графически представлять саму графему или же ее часть (например, различные диакритические знаки: ударения, умляуты, надстрочное двоеточие у буквы ё и т.д.).
Code Point — то, как записывается текст в представлении Unicode. Одна графема может записываться разными code points.
Code Points кодируются различным байтовым представлением в зависимости от стандарта: UTF-8, UTF-16, UTF-32, BE, LE…
Языки программирования, как правило, работают с code points; для нас, людей, привычно мыслить глифами.
Давайте же наконец разберемся с нашей буквой й. Что же в ней такого особенного?
Эта буква представляет из себя одну графему («и» краткое), но записана она двумя code points:
U+000438 CYRILLIC SMALL LETTER I
U+000306 COMBINING BREVE
Если вы проделали фокус с нажатием backspace, вы как раз и стерли COMBINING BREVE, или, говоря полиграфическим языком, значок краткости над гласной.
Обычная буква «и» краткое, которую мы все с вами привыкли набирать клавиатурой, представляет из себя композитный символ, который записывается одним code point:
U+000439 CYRILLIC SMALL LETTER SHORT I
Читать дальше →
Тэги: normalization, unicode, веб-разработка, нормализация, типографика
Использование эмоциональных иконок Emoji в коммитах на GitHub 2013-12-06 15:02:12
+ развернуть текст сохранённая копия
Некоторое время назад, сервис GitHub анонсировал возможность использовать эмоциональные иконки Emoji во всей своей GFM-разметке.
Мало кто знает, что эмоциональные иконки можно использовать не только в комментариях к pull requests и issues, но и в commit messages!
Читать дальше →
Тэги: emoji, git, github, open, source, unicode, веб-разработка, инфографика, юмор
вся проьлема в unocode 2012-07-23 13:48:08
вот блин называется...или кривые руки или тупой мозг, но я только что понял почему с моего смартфона ...
+ развернуть текст сохранённая копия
вот блин называется...или кривые руки или тупой мозг, но я только что понял почему с моего смартфона отправляются сообщения набранные по-русски, а отображаются получателями в виде вопросиков. оказывается в моем самсунг 7300 таки в настройках есть опция уникод, к-рую я включил и русский язык заработал!!!
Тэги: unicode, кодировка, самсунг, телефон, уникод
Информационная безопасность / [Перевод] Можно ли верить своим глазам? (Unicode в именах файлов) 2011-08-12 14:57:11
Несколько дней назад один из наших пользователей прислал образец (SHA1: ...
+ развернуть текст сохранённая копия
Несколько дней назад один из наших пользователей прислал образец (SHA1: fbe71968d4c5399c2906b56d9feadf19a35beb97, определяется как TrojanDropper:Win32/Vundo.L). Это троян для фишинга с сайтов vk.com и vkontakte.ru, запросы на которые перенаправляются на 92.38.209.252 необычным способом.
Обычный метод перенаправления трафика — добавить запись в файл hosts, который находится в папке %SystemRoot%\system32\drivers\etc. Однако, когда мы открываем этот файл на заражённом компьютере, то там нет никаких записей для vk.com и vkontakte.ru:
Читать дальше →
Тэги: rlo, unicode, vk.com, vundo, vundo.l, вконтакте, кириллица, символ, управляющий, фишинг, юникод
Android / Мечта любителя типографики сбывается: пополняем клавиатуру мобильника (снабжённого Android) русскими кавычками, тире, символами параграфа и приближённого равенства, буквами Имперской Речи 2011-06-18 16:29:12
Я не выношу скверной типографики, в которой роль тире играют дефисы, а «компьютерные < ...
+ развернуть текст сохранённая копия
Я не выношу скверной типографики, в которой роль тире играют дефисы, а «компьютерные кавычки» ("), более напоминающие знак дюйма или угловой секунды, употребляются вместо кавычек-«ёлочек», принятых в традиционной русской типографике. Мне также немало досаждает употребление обычного пробела вместо неразрывного, когда перевод строки по случайности разрывает словосочетание, создавая «висячие союзы», «висячие предлоги» и прочие формы неприглядного уродства. Я стремлюсь избегать этой скверны и оформлять свои тексты полноценно.
Под Windows и под Mac подспорьем поклонника типографики является раскладка Бирмана или другие аналогичные ей средства, а пользователи Linux используют несколько более сложные ([1], [2]), но всё же действенные изыски. И только под Android мне никак не удавалось (вплоть до сегодняшнего дня) достигнуть желаемого. Это было настоящим кошмаром, особенно когда в конце мая 2011 года кишечная инфекция привела меня на больничную койку в изоляторе, где ноутбуки были запрещены правилами внутреннего распорядка. Целую неделю пришлось валяться в обнимку с HTC Desire, купленным в прошлом году, и мучительно страдать от необходимости долгое время обходиться вообще без типографики, и даже после выздоровления не иметь возможности исправить её там, где реплики не поддаются исправлению (комментарии на Хабрахабре и в LiveJournal, микроблог в Твиттере, ответы на Формспринге…).
Тогда мне ещё казалось, что тупик безвыходен, совершенно безвыходен. Стандартная клавиатура HTC Sense не имеет редактируемой раскладки нестандартных символов, а её собственный набор их — далёк от желаемого. Множество других клавиатур, имеющихся в Android Market, также не содержат клавиши неразрывного пробела, не содержат достойных, полноценных кавычек. А некоторые плоды труда Юго-Восточной Азии даже и частью русских букв жертвуют — например, ознакомившись с одним из обзоров kedDroid, вы узнаете, что раскладка Go Keyboard не содержит твёрдого знака и буквы «ё» (и только XHunter мне подсказывает, что они есть там, доступные по длинному нажатию — просто не нарисованы с той же явственностью, с какой изображены цифры в верхнем ряду):
Как ни странно, азиатом же оказался и тот, кто помог мне найти выход из этого тупика. То был Jon Quach с бодрым видеообзором программы Smart Keyboard:
Читать дальше →
Тэги: android, desire, firefox, htc, keyboard, market, mobile, mozilla, multitouch, netscape, smart, suite, twitter, unicode, webkit
Главная / Главные темы / Тэг «unicode»
|
Взлеты Топ 5
Падения Топ 5
|