zirk.us is one of the many independent Mastodon servers you can use to participate in the fediverse.
Literature, philosophy, film, music, culture, politics, history, architecture: join the circus of the arts and humanities! For readers, writers, academics or anyone wanting to follow the conversation.

Administered by:

Server stats:

732
active users

#unicode

16 posts16 participants0 posts today
Replied in thread

@notjustbikes Unicode consortium in the 90s and 00s:
well, we can add the letter "A" three times for Latin, Greek and Cyrillic, but will unify the idiographs into single codespaces for Chinese, Japanese and Korean, even in cases when there are important differences between how they are written in each language.

Unicode consortium in the '20s: you get no "no cars" emoji, but here's a face with bags under the eyes.

Problem with special characters - PDF/UA - Screenreader:

I ran into a problem with two glyphs – 🅭 and 🅯 – when creating an accessible PDF. Text set in Source Sans 3.
Tests with InDesign/MadeToTag export and LibreOffice PDF/UA export show the following:
The PDF(s) pass the PDF/UA checks with PAC and pdfToolbox but 🅭 and 🅯 are not read aloud e.g. by Acrobat.

Is this a known issue?

🅭 (1F16D - CIRCLED CC)
🅯 (1F16F - CIRCLED HUMAN FIGURE)

Как досадить редактору: мастер-класс от юникодоведа для юникодоводов

#Unicode

Хочешь утончённо свести с ума редактора? Не нужно банальностей: не пиши капсом, не вставляй Comic Sans, не сыпь ошибками. Это всё слишком топорно. Включи изящную пакость: добавь после каждой буквы невидимый, непробельный, нерушимый символU+2060! А лучше несколько.

В чём суть?

  • Его не видно даже в режиме показа непечатных символов.
  • Все буквы разделены, так что проверка орфографии предательски молчит.
  • Внешне слово выглядит нормально, но ломает поиск.
  • Курсор тупо застревает в тексте, что-то исправить нереально.
  • Статистика не считает этот символ пробелом, так что число символов покажет такое, что Толстой позавидует.

Пример:

П⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠р⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠и⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠в⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠е⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠т⁠⁠⁠⁠⁠⁠,⁠⁠⁠⁠ ⁠⁠⁠⁠р⁠⁠⁠⁠⁠⁠е⁠⁠⁠⁠⁠⁠⁠⁠⁠д⁠⁠⁠⁠⁠⁠⁠⁠⁠а⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠к⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠т⁠⁠⁠⁠⁠⁠⁠⁠⁠о⁠⁠⁠⁠⁠⁠⁠⁠⁠⁠р⁠⁠⁠⁠⁠⁠⁠⁠⁠!⁠⁠⁠⁠ ⁠⁠⁠⁠К⁠⁠⁠⁠⁠а⁠⁠⁠⁠⁠⁠к⁠⁠⁠⁠ ⁠⁠⁠⁠н⁠⁠⁠а⁠⁠⁠⁠⁠⁠с⁠⁠⁠⁠⁠⁠т⁠⁠⁠⁠⁠⁠р⁠⁠⁠⁠⁠о⁠⁠⁠⁠⁠е⁠⁠⁠⁠⁠⁠н⁠⁠⁠⁠⁠⁠и⁠⁠⁠⁠⁠е⁠⁠⁠⁠⁠?

(между буквами — рандомное количество U+2060).

Что получаем?

  • На экране — нормальный текст.
  • Внутри — козьи какашки («ощущение наступления на дерьмо» ©).
  • Поиск по слову — не находит.
  • Проверка орфографии — молчит.
  • Подозрения — смутные.
  • Редактор — в ярости.

Предупреждение:

  • Работа в любом приложении не гарантируется! Word и Notepad ведутся, Notepad++ отображает квадратики, LibreOffice подсвечивает сереньким предыдущую букву.
  • Проверка орфографии всё же дуреет от такой прикормки (в зависимости от количества добавленных символов).
  • Если срать юникодом не после каждой буквы, а в конце слова, то орфография даст добро, при этом бонусы по объему текста и глючному курсору — сохраняются.
Replied in thread

@ale @pongo
#Unicode #Markdown #kb

Что это за странный символ на „я“?

Это zero-width non-joiner. В некоторых языках он используется, чтобы написать части слова раздельно. Но ещё он помогает отправлять текстовые смайлики в мессенджерах, которые их заменяют на эмоджи :-)

Интересное... По ходу joiner/non-joiner'ов нулевой ширины у нас как минимум четыре:

#Tag⁠s 👩🔬 U+2060 ⁠

  • Предотвращает разрывы строк, не влияя на лигатуры или сегментацию текста

#Tag​s 👩🔬 U+200B ​

  • Обозначает возможные точки разрыва строки, используется в языках без пробелов

#Tag‌s 👩🔬 U+200C ‌

  • Предотвращает соединение символов в скриптах с соединением, например, арабском

#Tag‍s 👩‍🔬 U+200D ‍

  • Заставляет символы соединяться, используется для лигатур и составных эмодзи

RE: mstdn.io/@ale/1142881360043707

MastodonAle ở Đà Nẵng! (@ale@mstdn.io)@pongo@mastodon.ml Подумал я что-то: а почему бы не запилить свою раскладку? Ну и запилил https://typo.ale.sh/

The word biáng is onomatopoeic, being said to resemble the sound of the thick noodle dough hitting a work surface.[..]

Both the traditional and simplified Chinese characters for biáng were encoded in Unicode, on 20 March 2020, for Unicode 13.0.0. The code point is U+30EDE for the traditional form (𰻞) and U+30EDD for the simplified form (𰻝).
Until that point, there were no standardized ways of entering or representing them on computers

en.wikipedia.org/wiki/Biangbia

Puzzling question of the day: why are there two #emojis / #Unicode code points for tickets?

🎟️ "Admission Tickets" ( U+1F39F)
🎫 "Ticket" (U+1F3AB)

The Unicode documentation seems to suggest that "admission tickets" don't refer to unique events, but merely to "access" (like to a museum); whereas "ticket" refers to performances and events.

However, almost all online emoji resource sites claim that "admission tickets" may refer to events, as well.

So: what's the rule, here?

Hey, fedi #Unicode nerds! :boostRequest:

#OpenStreetMap's Andy Mabbett (@Pigsonthewing) is asking whether anyone knows about any instances of the #OrdnanceSurvey's bench mark symbol appearing in actual print, on a page. Looks a bit like ⭱ or ⤒ but a broader arrow. Usually found carved on stone or brick all over the UK/ROI.

Their goal is to propose it as a Unicode symbol! community.openstreetmap.org/t/

Any known international usage of this symbol would doubtless be appreciated too

@openstreetmap