Лекция – Юникод: как люди учат компьютеры понимать все письменности мира
Александр Запрягаев
Математик, специалист по математической логике, кандидат наук. Выпускник мехмата, преподаёт в Высшей школе экономики и занимается языками. Увлекается историей китайского и японского языков, а также всеми аспектами китайской письменности. Протаскивает символы в Юникод.

Появление стандарта Юникод в конце 1980‑х приблизило человечество к мечте сохранить все тексты мира в едином компьютерном формате. Первоначально лишь обобщавший уже существовавшие к тому моменту кодировки текста, Юникод постепенно взял на себя более амбициозную задачу — закодировать для компьютеров все существующие ныне и в прошлом письменности мира. Ныне он включает 159801 символ из 172 письменностей – но как она работает и кто те люди, которые его из года в год пополняют?
Мы не только обсудим то, как Юникод устроен, как компьютеры его понимают и как шрифты воспроизводят его в понятной для людей форме, но и посмотрим на пасхальные яйца и ляпы, оставшиеся со старых версий, увидим, как включение в Юникод оживляет письменности и целые языки, как Юникод защищён от ошибок при передаче файлов и почему эмодзи 👩🏻❤💋👨🏼 – это на самом деле десять символов (U+1F469 U+1F3FB U+200D U+2764 U+FE0F U+200D U+1F48B U+200D U+1F468 U+1F3FC)!
А ещё 63,8% всего Юникода состоит из китайских иероглифов — мы разберёмся, почему так получилось, как новые символы попадают в Юникод каждый год и чем каждый из нас может поспособствовать включению новых (а то и добиться включения символа, придуманного вами самими)!


