人名漢字と向きあう 〜異体字を扱ってみた〜 by hamaco

PHPerKaigi 2020
15分トーク

人名漢字と向きあう 〜異体字を扱ってみた〜

hamaco hamaco hamaco
2

東京都にある「葛󠄁飾区」と奈良県にある「葛󠄀城市」はどちらも同じ「葛(カツ)」という字が使われていますが、よく見ると文字の形が違っています。
これらの意味としては同じだけど、字形が異なる文字は異体字と呼ばれており、「沢」と「澤」のような分かりやすいものから、「はしご高(髙)」や「立つ崎(﨑)」などの細かい字形が違うものなど様々なものがあります。

日本人には切っても切り離せないこの異体字、Webで扱おうとするとなかなかハードルが高いです。
しかし、実はこの異体字を扱う仕組みは世界中で使われるようになってきており、今ではいくらか制限はありますが、Webでもこれらの漢字が扱えるようになり始めています。
このセッションでは、異体字とはなんなのか、PHPで異体字を扱うためにどんな苦労をした(している)のかを話したいと思います。

話す事
・異体字とは
・異体字がパソコン上でどう扱われているのか
・異体字と外字について
・異体字を読み書きする為の方法
・異体字をPHPで扱う時に困ったこととか