<aside>
💡 YANS2023での、くふうカンパニー / くふうAIスタジオ のブースデモ&ブースポスター展示で紹介している、大規模言語モデルは、絵文字の分散表現をどう見るか についてのページです
</aside>
🎨Emoji Embedding Projector
🤗 楽しみ方
- 絵文字アイコンをクリックすると、その絵文字の類似 Top-100 が表示されます。
- 左下の PCA タブでは、主成分の上位1-10が表示され、そのうち3つを使い3D空間にマッピングできます。
- 例えば、#1(第一主成分)は国旗なので、#1 を選択しないことで、国旗の集合がなくなるでしょう
- T-SNE タブでは、各種パラメータに沿って収束していく様も見ることが出来ます。
- UMAP / T-SNE の各種パラメータを変更することで、クラスターへの集約を視覚的に理解しやすくなります。
- 左上のデータソースを変更することで、顔文字のみや標準化(z-score)済みに差し替えることも可能です。
絵文字の文ベクトルと、絵文字のマッピング