難読・稀少漢字山名

難読山名の全国1位は大分県の日田市と中津市の境にある一尺八寸山で、「いっしゃくはっすんやま」ではなく、何と「みおうやま」と読むそうである。これは1996年、パソコン通信のフォーラム(今は亡きNIFTY-Serve FYAMA)で開催された日本異様難読山名コンテストにおいて投票で選定されたもので、難読山名ベスト20(20位が2座あるので計21座)は次の表の順となっている(参考:大竹美緒子著『山の名前っておもしろい!』)。

山名 位置 標高[m] 都道府県 備考
一尺八寸山みおうやま 地図 707 大分 1位。
爺爺岳ちゃちゃだけ 地図 1822 北海道 2位。北方領土の最高峰。
月出山岳かんとうだけ 地図 709 大分 3位。
雲母峰きららみね 地図 888 三重
岨巒堂山しょらんどうやま 地図 751 新潟
阿哲台あてつだい 地図 ※1 岡山 ※1 標高500m前後のカルスト台地。
梅花皮岳かいらぎだけ 地図 2000 山形、新潟
本富岳もっちょむだけ 地図 940 鹿児島 モッチョム岳の別名。
鰻轟山うなぎとどろきやま 地図 1046 徳島
後方羊蹄山しりべしやま 地図 1898 北海道 日本百名山。羊蹄山ようていざんの別名。
設計山もっけやま 地図 702 北海道
万年山はねやま 地図 1140 大分
父不見山ててみえずやま 地図 1047 群馬、埼玉 ててみずやま、ててみえじやまとも読む。
山毛欅潰山ぶなつぶれやま 地図 898 山形
皇海山すかいさん 地図 2144 栃木、群馬 日本百名山。
子檀嶺岳こまゆみだけ 地図 1223 長野
光岳てかりだけ 地図 2592 長野、静岡 日本百名山。
大根下山だいこんおろしやま 地図 1083 福島
行縢山むかばきやま 地図 830 宮崎
犢牛岳こっといだけ 地図 690 福岡
天狗角力取山てんぐすもうとりやま 地図 1360 福島

このコンテストが行われた1996年はWindows 95の時代で、文字コードはShift_JIS、パソコンで扱える漢字はJIS X 0208の第1、第2水準漢字にNEC選定IBM拡張文字を加えたものが事実上の標準であった。上記の難読山名はどれもShift_JISで表示できるが、山名などの固有名詞には用例が稀少でShift_JISにない漢字が含まれることが多々あり、文書やウェブページに漢字で表示することが難しかった山名がある。

(注:正確には拡張文字を加えた文字コードはCP932と呼ばれるが、ウェブページで指定する際はShift_JISでもCP932でも表示は多分同じである。)

一例を挙げると、飯豊連峰の朳差岳は日本二百名山の一座なので出現頻度が高い山名であるが、「朳」はShift_JISにないので、文書ならば外字を作る、ウェブページならば画像化する、あるいは諦めて「えぶり差岳」とひらがなで表記するしかない。また、第2水準漢字に見た目が良く似た「杁」があるため、杁差岳と誤記されたケースも多く、現在もググると大量にヒットする。朳(えぶり)は土をならす農具で、横木にのこぎり状の歯がついていないもの、杁(いり)は氏名や地名に用いる国字で、両者は本来的に別の漢字である。

なお、燧ヶ岳の最高峰の柴安嵓も日本百名山の一座で出現頻度が高く、かつ第1、第2水準漢字にない「嵓」を含む山名であるが、「嵓」は幸いNEC選定IBM拡張文字に含まれていたので、これは問題なく表示できた。

その後、JIS X 0208に第3、第4水準漢字を加えたJIS X 0213が2000年に制定され、2003年にUnicode 3.1がJIS X 0213を正式サポート、2004年にはJIS X 0213が改定されてJIS X 0213:2004(通称、JIS2004)となり、Windows Vistaから対応フォント(メイリオ、MS明朝、MSゴシック)が標準装備されるようになった。文字コードとしてUTF-8を用いれば、JIS2004の第1水準第2水準第3水準第4水準をフル活用することができるようになり、漢字が表示できなくて困るケースはほぼなくなった。

(注:HTMLではUnicodeの文字を数値文字参照で記述することができ、Shift_JISのページでも朳(UnicodeコードポイントU+6733)は「朳」と表記できる。もちろん、閲覧する側に対応フォントが普及して、初めて役立つようになった方法である。)

ウェブページの作成では、GoogleがUnicodeの全文字に対応したGoogle Noto Fontsを開発してオープンソースで公開しており、2014年7月にNoto Sans CJK(日中韓サンセリフ書体)、2017年4月にNoto Serif CJK(日中韓明朝体)がリリースされている。なお、Notoとはno more tofuの意味とか(^^)。Noto フォントはウェブフォントとしても利用でき、ブラウザ側にフォントがない漢字でも表示可能となる。

このページは当然、UTF-8で記述され、さらに要所でNotoフォントをウェブフォントとして利用しているので、サポートが終了したレガシーブラウザでなければ、豆腐(表示できない文字の代わりの□)は出ないはずである。

JIS2004とUTF-8を活用できる環境が広く普及した結果、ウェブサイトの文字コードはUTF-8が大半を占めるようになった(2017年10月のINTERNET Watchの「ウェブサイトにおける文字コードの割合、UTF-8が90%超え。Shift_JISやEUC-JPは?」の記事)。

ここまでが前置きで、技術的な説明が大変長くなった。そんな訳で、Shift_JISが主流の時代に行われた難読山名コンテストでは、表示が困難で見過ごされていたであろう第3、第4水準漢字(=稀少漢字)を含む山名(見たことがないような漢字を含むので、必然的に難読山名となる)にはどんなものがあるかな、と調べてみたところと、稀少地名漢字リストというサイトを発見。第3、第4水準の漢字毎に地名の実例が挙げられている。

この中から抽出した山名(いくつか私が追加)が以下の表である。赤字が稀少漢字を表す。以下の表中の山名は3座(品刕、峨嶁山、大癭ヶ嶽)を除いて全て三省堂日本山名事典 改訂版(2011年)に掲載されている(山名事典すごい!)。山名事典と地形図の表記が相違する場合は、原則として山名事典に合わせた。

JIS第3水準漢字を含む山名

」には第1水準に異体字「莱」があるが、印刷標準字体の前者を用いた。また、「」には第2水準に異体字で簡易慣用字体の「屏」があるが、印刷標準字体の前者を用いた。「屛」を含む山名には、下記の他に屛風岩山、屛風立山、屛風ノ頭、屛風ノ耳がある。

山名 位置 標高[m] 都道府県 備考
やくらいざん 地図 553 宮城
ほうらいざん 地図 1174 滋賀 全国に同名の山が9座。
風岳びょうぶだけ 地図 1825 宮城 全国に同名の山が10座。
風山びょうぶさん 地図 1354 福井、岐阜 全国に同名の山が12座。
差岳えぶりさしだけ 地図 1636 新潟 日本二百名山。「杁差岳」は誤記。
柴安しばやすぐら 地図 2356 福島 燧ヶ岳(日本百名山)の最高峰。
まないたぐら 地図 2323 福島
倉山がんくらやま 地図 726 青森
りゅうがんざん 地図 154 島根
吐噶富士とからふじ 地図 979 鹿児島 中之島の御岳おたけの別名。
迦陵伽岡かりょうびんがおか 地図 215 岩手 「迦陵頻伽岡」と表記されることも多い。
さったやま 地図 244 静岡
おだるやま 地図 1342 長野
三本さんぼんぶなやま 地図 606 新潟 地形図の「三本撫山」は誤記と思われる。
わかぶなやま 地図 630 新潟
風呂山かしわぶろやま 地図 713 広島 別名、槲風呂山。
良山までらさん 地図 295 福岡 麻底良山の別名。頂上に麻氐良布神社がある。
足山けいそくさん 地図 430 茨城 別名、鶏足山。
とどやま 地図 465 岩手
かしべだけ 地図 599 青森
びしゃごだけ 地図 885 鹿児島
以下の3座は山名事典に記載なし
しなしゅう 地図 639 埼玉 二等三角点、点名:品藾(ひんしゅう)
がろうざん 地図 190 福島 ふくしま市景観100選
ヶ嶽おおこぶがたけ 地図 639 兵庫 三等三角点、点名:茅谷

JIS第4水準漢字を含む山名

UTF-8では常用の漢字は3バイトで表されるが、中には4バイトを要するものがある。下表の最初の4つの山名の赤字(備考のカッコ内にUnicodeのコードポイントを記したもの)がそれである。ソフトウェアによっては、4バイトUTF-8(以下、utf8mb4と略)は取り扱えなかったり、特殊な設定が必要になる場合がある。

山名 位置 標高[m] 都道府県 備考
𡴭おおかみだわさん 地図 928 和歌山 (U+21D2D)別名、狼峠山。
𡶒沢山いしへつりざわやま 地図 792 福島 (U+21D92)
𣘹原山たららやま 地図 1392 長野 (U+23639)
𥹖すくもづか 地図 55 鳥取 (U+25E56)鳥取県で最も低い山。
樿つげやま 地図 935 北海道
たかつぶりやま 地図 933 福島
馿ノ峰とどのみね 地図 474 新潟 海鑪ノ峰の別名

JIS2004外の漢字を含む山名

」はJIS X 0212 補助漢字に含まれていたが、JIS X 0213に入れて貰えなかった。しかし、補助漢字も全てUnicodeに取り込まれているので、UTF-8では使用可能である。

山名 位置 標高[m] 都道府県 備考
やはずやま 地図 484 和歌山

ちなみに、このページを2014年にサポートが終了した古のWindows XPのInternet Explorer 8で試しに閲覧してみたら、utf8mb4の4文字が豆腐になったが、それ以外は正常に表示された。また、メモ帳も(utf8mb4は取り扱えないが)UTF-8の編集・表示が可能であった。XPは結構出来る子だったんだね。お見逸れしていました。まあ結論は、サイトの文字コードはUTF-8にしておけ、ただしutf8mb4には気をつけろ、ということで(^^;)


あにねこ登山日誌 © 2018 anineco.org