In this post

Emoji 起源于日本,最初用于手机短信服务,如今已成为全球交流的重要工具。它不仅丰富了情感表达,还跨越了语言障碍,为不同文化背景的人们提供了一种新的交流方式。

对于 90 后最早接触到表情符号,是通过颜文字以及 QQ 的表情。曾经酷爱颜文字以及纯文本的我也渐渐的在交流中喜欢带上 Emoji,在文档中用 Emoji 来作为 icon 表示一些含义,例如文件夹、工作等等浓缩的含义。相较于颜文字的可爱俏皮,Emoji 表达同样意思的同时,更加正式却不失俏皮。甚至在 2015 年,牛津词典大胆决定将 😂 (Face with Tears of Joy) 评选为年度词汇,以及 2011-2021 年所有平台上使用最多的表情符号。2021 年被 😭 (Loudly Crying Face) 短暂超越 ,成为 Twitter(彼时他还叫这个名字)上的热门表情符号,截至 2022 年 1 月,它已经重新夺回了在该平台上的头把交椅。

Emoji 类似于象形文字,是一种跨越语言障碍的视觉表达方式,能够传达情感、动作和概念。但不同文化对于同样的图像解读不同,在日本,💮 表示“好成绩”,而在西方国家可能被误解为“花”。这种文化差异使得 Emoji 的设计和使用需要特别注意文化敏感性。我日常使用的几个 Emoji 都符合他原本的含义,但有个除外 🌚,在特定的人群中(我的朋友)中他有约定俗成的含义-尴尬到无话可说(其实和 Doge 的用法类似)。

Emoji 的设计涉及复杂的技术实现,主要包括 Unicode 编码、变体选择符以及字符组合方式。以下是一些关键点:

  1. 单一字符。最基本的 Emoji 是一个 Unicode 编码就代表一个表情。
    • 😀 (U+1F600)
    • ❤️ (U+2764)
  2. 符号 + 变体选择符(Variation Selectors U+FE0F)。这类符号本身就是纯文本,比如 ♥(U+2665),它默认显示为黑色实心心形,但加上一个变体选择符后就可以指定符号显示为图像。
    • ❤ → 黑心(符号风格)
    • ❤(U+2764 + U+FE0F)→ ❤️(emoji 风格)
  3. 字符组合,由零宽连字(Zero Width Joiner, ZWJ, U+200D)拼接而成。
    • 👨 + U+200D + 🍼 → 👨‍🍼
    • 👨 + U+200D + 💻 → 👨‍💻
  4. 字符组合,直接拼接。

由此我们可以看出 Emoji 出了基础的 Emoji 是占用了单独的 Unicode 坑位,其他的都是基于部分符号、基础 Emoji 拼接构成。这样的构成方式并不只是因为 Unicode 的空间是有限的(Unicode 理论上支持超过 100 万字符),更是因为组合方式更加灵活、更可持续发展。

一开始 Emoji 只有默认性别(通常是男性),由于政治正确,现在支持男性、女性和中性;各种肤色的支持;家庭结构多样性(父母不仅仅是男女);伴侣性取向同性的支持(包括 LGBTQ+ 社群旗帜);文化与宗教多样性(穆斯林女性 🧕,印度庙宇 🛕等等);残障相关。Emoji 的多样性不仅体现在肤色和性别的选择上,还扩展到性取向和宗教信仰。这种代表性反映了社会对包容性和多样性的持续关注和推动。

以上各种如果全部都分配单独的 Unicode 表示,将会占用相当大的 Unicode 字符空间。因此通过基础组件(人、性别、颜色、职业)去组成各种组合,形成「模块化」的标准化,可以更方便的去扩展 Emoji 的覆盖范围。更棒的一点是,组合 Emoji 形成新 Emoji 的方式可以做到「向后兼容」,简而言之,在不支持新 Emoji 的老设备上,组合式的 Emoji 铺开展示,也可以让人猜到要表达的含义。比如:你发了👨‍🚀,旧手机可能看到的是「👨🚀」两个 Emoji,是可以大概猜出并理解其含义的。

总之,Emoji 已经从简单的表情符号演变为一种强大的交流工具。随着技术的进步,Emoji 在增强现实和虚拟现实中的应用前景广阔,将继续丰富我们的数字生活。