Unicodeバージョンと絵文字の進化
Unicodeの各バージョンで追加された絵文字とその背景を解説します
絵文字がUnicodeに入るまで
2000年代後半、日本の携帯電話には絵文字が当たり前のように搭載されていた。NTTドコモ、au、SoftBankの3キャリアがそれぞれ独自の絵文字セットを持ち、キャリア間でメールを送ると絵文字が文字化けする問題が日常的に起きていた。
この問題を国際標準で解決しようとしたのが、Unicode Consortium共同創設者のMark Davis氏らだった。2007年、Davis氏のチームはUnicode Technical Committee(UTC)に絵文字の標準化を提案し始めた。2009年2月、UTCは将来のUnicode Standardに674文字の絵文字を含める決議を採択した。AppleのシニアソフトウェアエンジニアPeter Edberg氏がこの動議を支持し、UTCの会議メモに「emoji」という語が初めて正式に記録された。
Unicode 6.0(2010年)――絵文字標準化の始まり
2010年10月にリリースされたUnicode 6.0で、722種類の文字が絵文字として扱われることになった。このうち114文字はUnicode 5.2に既に含まれていたMiscellaneous SymbolsブロックやDingbatsブロックの記号で、残りの608文字が絵文字用の新規コードポイントとして追加された。
722文字は日本の3キャリアが持っていた絵文字の和集合として構成された。ドコモの「i-mode」向け絵文字、auの「EZweb」向け絵文字、SoftBankの絵文字がひとつの標準に統合された。文字化けの問題がすぐに消えたわけではないが、共通のコードポイントが定まったことで解消に向かう土台ができた。
翌年、AppleがiOS 5で絵文字キーボードを標準搭載した。これをきっかけに英語圏のユーザーが絵文字を使い始め、世界的な普及が一気に進んだ。
Unicode 7.0(2014年)――Webdings・Wingdingsの取り込み
2014年6月のUnicode 7.0では、MicrosoftのWebdingsフォントとWingdingsフォントに含まれていた文字がUnicodeに取り込まれた。追加された約250文字のうち、絵文字表示が推奨されたのは約103文字だった。残りはUnicodeにエンコードはされたが、公式に「絵文字」として指定されたわけではなかった。
このバージョンで追加された文字としては、Slightly Smiling Face(🙂)がある。Unicode 6.0にも笑顔の絵文字はあったが、☺(White Smiling Face)とはニュアンスの異なる控えめな微笑みとして追加された。また、Webdingsのデザイナーがレコードレーベルのロゴにちなんで作ったMan in Business Suit Levitating(🕴)のような珍しい文字も含まれていた。
Unicode 8.0 / Emoji 1.0(2015年)――肌色と最初のEmoji標準
2015年6月にUnicode 8.0がリリースされ、37の新規絵文字に加え、5つの肌色修飾子が追加された。
肌色修飾子は皮膚科で使われるFitzpatrick Scaleに基づいている。元のスケールは6段階だが、TypeIとTypeIIが統合されて5段階(やや明るい肌色から暗い肌色まで)になった。人物の絵文字の直後にこの修飾子を置くことで、肌の色を変えられる仕組みだ。
同年6月にはEmoji 1.0も公開された。UTR #51(Unicode Technical Report #51)として発行されたこの仕様は、どのUnicode文字を絵文字として扱うべきかを初めて公式に定義した。肌色修飾子の仕組み、家族やカップルのZWJシーケンス、バリエーションセレクタがない場合の表示推奨もここで文書化された。
Unicode 8.0で追加された絵文字には、Thinking Face(🤔)、Upside-Down Face(🙃)、Unicorn(🦄)、Taco(🌮)などがある。
Unicode 9.0(2016年)――日常会話の絵文字が充実
Unicode 9.0 / Emoji 3.0では72の新規絵文字が追加された。このバージョンの特徴は、日常会話で頻繁に使われるジェスチャーや表情が多かったことだ。
Shrug(🤷、肩をすくめる)、Face Palm(🤦、顔を手で覆う)、ROFL(🤣、転げ回って笑う)、Selfie(🤳)、Fingers Crossed(🤞、幸運を祈る)といった絵文字は、テキストでは伝えにくい身体表現をカバーした。動物ではFox(🦊)やGorilla(🦍)、食べ物ではBacon(🥓)が加わった。
Unicode 10.0-11.0(2017-2018年)
Unicode 10.0 / Emoji 5.0(2017年)では56の新規絵文字が追加された。T-Rex(🦖)やGiraffe(🦒)、Star-Struck(🤩)やExploding Head(🤯)が含まれる。このバージョンでEmoji仕様はUTR #51からUTS #51(Unicode Technical Standard)に格上げされ、独立した技術標準になった。
Unicode 11.0 / Emoji 11.0(2018年)では66の新規コードポイントが追加され、肌色やジェンダーのバリエーションを含めると157の新規絵文字になった。Superhero(🦸)やSupervillain(🦹)に加え、赤毛・巻き毛・白髪・無毛のバリエーションが登場した。
Emoji 5.0の次がEmoji 11.0に飛んでいるのは、Unicode Standardとバージョン番号を同期させたためだ(Emojiバージョンの6.0から10.0が欠番になった)。
Unicode標準とEmoji標準の関係
Unicode Standardは文字のコードポイントを定義する仕様で、絵文字以外にも世界中の文字体系を収録している。Emoji Standardは別の仕様で、「どのコードポイントを絵文字として扱うか」「どのシーケンスを推奨するか」を定める。
Emoji 1.0(2015年)で独立したバージョニングが始まったが、両者は必ずしも同時にリリースされるわけではない。Emoji 2.0(2015年11月)、Emoji 4.0(2016年11月)、Emoji 13.1(2020年9月)などは、新規コードポイントの追加を伴わず、既存コードポイントへの新しいシーケンス追加や表示推奨の変更だけを行った。
Emoji 11.0以降はUnicode Standardとバージョン番号が概ね揃えられた。ただしEmoji 12.1や13.1のように、マイナーリリースでずれることはある。
ZWJシーケンスの仕組み
Zero Width Joiner(ZWJ、U+200D)は、ゼロ幅の書式文字だ。複数の絵文字の間にZWJを挟むと、対応するシステムでは1つの絵文字として表示される。
たとえば、Woman(👩)+ ZWJ + Wrench(🔧)で「女性の整備士」(👩🔧)になる。Man + ZWJ + Man + ZWJ + Girl + ZWJ + Boyで「男性2人と女の子と男の子の家族」(👨👨👧👦)になる。
この仕組みには後方互換性がある。ZWJシーケンスに対応していないシステムでは、ZWJ文字が無視されて構成要素の絵文字が個別に表示される。意図した見た目にはならず、職業や家族構成が正しく伝わらないこともあるが、完全に読めなくなるわけではない。
Unicode ConsortiumはRGI(Recommended for General Interchange)として推奨するZWJシーケンスのリストを公開しており、プラットフォーム各社はこのリストを優先的にサポートしている。
Unicode 12.0-14.0(2019-2021年)
Unicode 12.0 / Emoji 12.0(2019年)では、Appleが2018年に提案したアクセシビリティ関連の絵文字が入った。白杖を持つ人、手動車椅子、電動車椅子、義手、義足、盲導犬、介助犬など。肌色の異なるカップル絵文字も加わった。ベースの59絵文字にバリエーションを含めて合計230になった。
Unicode 13.0 / Emoji 13.0(2020年)ではNinja(🥷)やBubble Tea(🧋)など55の新規コードポイントが追加された。Emoji 13.1(2020年9月)はUnicode更新なしで公開され、混合肌色のHandshakeやKissなど217の新規絵文字(大半は肌色バリアント)を導入した。
Unicode 14.0 / Emoji 14.0(2021年)では37の新規コードポイントが追加された。Melting Face(🫠)、Saluting Face(🫡)、Heart Hands(🫶)のほか、Pregnant Man(🫃)やPregnant Person(🫄)も入った。
近年の動向(2022-2025年)
Unicode 15.0 / Emoji 15.0(2022年)では20の新規コードポイントが追加されたが、シーケンス含め合計31の推奨絵文字という、Emojiバージョン制度が始まって以来最小の規模だった。Shaking Face(🫨)やPink Heart(🩷)、Jellyfish(🪼)、Moose(🫎)が含まれる。
Unicode 15.1 / Emoji 15.1(2023年)では新規コードポイントの追加がゼロだった。6つの新しい絵文字概念(横に首を振る、縦に首を振る、ライム、フェニックス、茶色キノコ、壊れた鎖)は全てZWJシーケンスとして実装された。たとえばPhoenix(🐦🔥)はBird + Fireの組み合わせ、Lime(🍋🟩)はLemon + Green Squareの組み合わせだ。方向指定バリアントや家族絵文字を含め、合計118の新規絵文字になった。
Unicode 16.0 / Emoji 16.0(2024年)では7つの新規コードポイントで8つの絵文字が追加された。Harp、Shovel、Face with Bags Under Eyes、Fingerprint、Splatter、Root Vegetable、Leafless Tree、Flag: Sarkだ。この時点でRGI絵文字の総数は3,790に達した。
Unicode 17.0 / Emoji 17.0(2025年9月)では7つの新規コードポイントに加え、既存絵文字への肌色シーケンス追加により合計163の新規絵文字が追加された。Distorted Face、Ballet Dancer、Orca(シャチ)、Trombone、Treasure Chestなどが含まれる。RGI絵文字の総数は約3,953になった。
絵文字の提案プロセス
新しい絵文字の追加は、誰でも提案できる。Unicode Consortiumに対してPDF形式の提案書を提出し、カラーと白黒のサンプル画像(18x18ピクセルと72x72ピクセル)を添える必要がある。
提案には使用頻度の証拠が必須で、Google検索、Google動画検索、Googleトレンド(Web検索と画像検索の両方)、Google Books Ngram Viewerからのスクリーンショットを提出する。比較基準は「elephant」で、これは使用頻度の中央値に近い絵文字として選ばれたベンチマークだ。署名活動やハッシュタグは証拠として認められない。
UTCは複数の基準で評価する。世界的に使用頻度が高いか、既存の絵文字と重複しないか、18x18ピクセルで識別できるか、複数の意味やメタファーを持つか、などだ。
ロゴやブランド、特定の人物や建物、神格、テキストを含むものは自動的に却下される。国旗の新規提案は現在受け付けられておらず、ISO 3166-1のリージョンコードに基づく旗は自動的に追加される仕組みだ。却下された提案は4年間再提出できない。
UTCは四半期ごとに会合を開き、提案をProvisional Candidate、Draft Candidate、Final Candidateへと段階的に審査する。提案から実際のリリースまでは通常2年程度かかる。
現在の絵文字
Emoji 17.0の時点で、RGI絵文字の総数は約3,953だ。People & Bodyカテゴリが最も多く、肌色やジェンダーのバリエーションがその大部分を占める。
2010年に722文字だった絵文字は、15年で約3,953になった。初期はキャリア間の文字化けを解消するための規格整備だったが、肌色修飾子やZWJシーケンスが加わるにつれ、誰をどう表現するかという問題と向き合うことになった。新規コードポイントの追加は年々少なくなっているが、既存の文字を組み合わせるZWJシーケンスでの拡張は今も続いている。