難読・稀少漢字山名

難読山名の全国1位は大分県の日田市と中津市の境にある一尺八寸山で、「いっしゃくはっすんやま」ではなく、何と「みおうやま」と読むそうである。これは1996年、パソコン通信のフォーラム(今は亡きNIFTY-Serve FYAMA)で開催された日本異様難読山名コンテストにおいて投票で選定されたもので、難読山名ベスト20(20位が2座あるので計21座)は次の表の順となっている(参考:大竹美緒子著『山の名前っておもしろい!』)。

山名 位置 標高[m] 都道府県 備考
一尺八寸山みおうやま 地図 707 大分 1位。
爺爺岳ちゃちゃだけ 地図 1822 北海道 2位。北方領土の最高峰。
月出山岳かんとうだけ 地図 709 大分 3位。
雲母峰きららみね 地図 888 三重
岨巒堂山しょらんどうやま 地図 751 新潟
阿哲台あてつだい 地図 ※1 岡山 ※1 標高500m前後のカルスト台地。
梅花皮岳かいらぎだけ 地図 2000 山形、新潟
本富岳もっちょむだけ 地図 940 鹿児島 モッチョム岳の別名。
鰻轟山うなぎとどろきやま 地図 1046 徳島
後方羊蹄山しりべしやま 地図 1898 北海道 日本百名山。羊蹄山ようていざんの別名。
設計山もっけやま 地図 702 北海道
万年山はねやま 地図 1140 大分
父不見山ててみえずやま 地図 1047 群馬、埼玉 ててみずやま、ててみえじやまとも読む。
山毛欅潰山ぶなつぶれやま 地図 898 山形
皇海山すかいさん 地図 2144 栃木、群馬 日本百名山。
子檀嶺岳こまゆみだけ 地図 1223 長野
光岳てかりだけ 地図 2592 長野、静岡 日本百名山。
大根下山だいこんおろしやま 地図 1083 福島
行縢山むかばきやま 地図 830 宮崎
犢牛岳こっといだけ 地図 690 福岡
天狗角力取山てんぐすもうとりやま 地図 1360 福島

このコンテストが行われた1996年はWindows 95の時代で、文字コードはShift_JIS、パソコンで扱える漢字はJIS X 0208の第1、第2水準漢字にNEC選定IBM拡張文字を加えたものが事実上の標準であった。上記の難読山名はどれもShift_JISで表示できるが、山名などの固有名詞には用例が稀少でShift_JISにない漢字が含まれることが多々あり、文書やウェブページに漢字で表示することが難しかった山名がある。

(注:正確には拡張文字を加えた文字コードはCP932と呼ばれるが、ウェブページで指定する際はShift_JISでもCP932でも表示は多分同じである。)

一例を挙げると、飯豊連峰の朳差岳は日本二百名山の一座なので出現頻度が高い山名であるが、「朳」はShift_JISにないので、文書ならば外字を作る、ウェブページならば画像化する、あるいは諦めて「えぶり差岳」とひらがなで表記するしかない。また、第2水準漢字に見た目が良く似た「杁」があるため、杁差岳と誤記されたケースも多く、現在もググると大量にヒットする。朳(えぶり)は土をならす農具で、横木にのこぎり状の歯がついていないもの、杁(いり)は氏名や地名に用いる国字で、両者は本来的に別の漢字である。

なお、燧ヶ岳の最高峰の柴安嵓も日本百名山の一座で出現頻度が高く、かつ第1、第2水準漢字にない「嵓」を含む山名であるが、「嵓」は幸いNEC選定IBM拡張文字に含まれていたので、これは問題なく表示できた。

その後、JIS X 0208に第3、第4水準漢字を加えたJIS X 0213が2000年に制定され、2003年にUnicode 3.1がJIS X 0213を正式サポート、2004年にはJIS X 0213が改定されてJIS X 0213:2004(通称、JIS2004)となり、Windows Vistaから対応フォント(メイリオ、MS明朝、MSゴシック)が標準装備されるようになった。

(2018-07-29追記:また、JIS2004に対応したフリーなフォントとしては、情報処理推進機構が公開しているIPAexフォントがある。)

文字コードにUTF-8を用いれば、JIS2004の第1水準第2水準第3水準第4水準をフル活用することが可能となり、漢字が表示できなくて困るケースはほぼなくなった。

(注:HTMLではUnicodeの文字を数値文字参照で記述することができ、Shift_JISのページでも朳(UnicodeコードポイントU+6733)は「朳」と表記できる。もちろん、閲覧する側に対応フォントが普及して、初めて役立つようになった方法である。)

ウェブページの作成では、GoogleがUnicodeの全文字に対応したGoogle Noto Fontsを開発してオープンソースで公開しており、2014年7月にNoto Sans CJK(日中韓サンセリフ書体)、2017年4月にNoto Serif CJK(日中韓明朝体)がリリースされている。なお、Notoとはno more tofuの意味とか(^^)。Noto フォントはウェブフォントとしても利用でき、ブラウザ側にフォントがない漢字でも表示可能となる。

このページは当然、UTF-8で記述され、さらに要所でNotoフォントをウェブフォントとして利用しているので、サポートが終了したレガシーブラウザでなければ、豆腐(表示できない文字の代わりの□)は出ないはずである。

JIS2004とUTF-8を活用できる環境が広く普及した結果、ウェブサイトの文字コードはUTF-8が大半を占めるようになった(2017年10月のINTERNET Watchの「ウェブサイトにおける文字コードの割合、UTF-8が90%超え。Shift_JISやEUC-JPは?」の記事)。

(2020-03-07追記:Microsoftも「Windows と日本語のテキストについて」という文書を公開して、Shift_JISからUTF-8への移行を推奨している。)

ここまでが前置きで、技術的な説明が大変長くなった。そんな訳で、Shift_JISが主流の時代に行われた難読山名コンテストでは、表示が困難で見過ごされていたであろう第3、第4水準漢字(=稀少漢字)を含む山名(見たことがないような漢字を含むので、必然的に難読山名となる)にはどんなものがあるかな、と調べてみたところと、稀少地名漢字リストというサイトを発見。第3、第4水準の漢字毎に地名の実例が挙げられている。

2020-08-22改訂:今回、「山名一覧 on the Web地図」に収録している約20,000座の山名を全数調べて、第3、第4水準の漢字を含む山名を抽出した。次表にその結果を示す。ここで、当該の漢字に第1、第2水準の異体字がある場合は、それを「代替」の欄に示した。表中の文字色は常用漢字印刷標準字体簡易慣用字体を表す。異体字がある場合、使用する漢字は常用漢字と印刷標準字体から選ぶのが現代の標準である。

水準漢字代替山名
3品刕
3白剝山、剝岳、切剝山
3水吞場山、吞岡山、水吞山
3吐噶喇富士
3嚙伊尻
3迦陵嚬伽岡
3男埵山、薩埵山
3屛山、屛風山、屛風岳、屛風ノ耳、屛風ノ頭、屛風岩山、屛風立山、南屛風岳
3嵓倉山、俎嵓、白嵓、竜嵓山、白嵓ノ頭、赤嵓北峰、柴安嵓、向赤松嵓
3峨嶁山
3大摑山
3朳差岳、前朳差岳
3橅生、若橅山、三本橅山、橅峰
3檞風呂山
3麻氐良山
3大癭ヶ嶽
3瓢簞山、大瓢簞山、瓢簞崩山
3茶荃山
3荢山
3蓬萊山、薬萊山、蓬萊尾山、東蓬萊山
3蟬ヶ岳、蟬山、蟬倉山、蟬峠山
3雞足山
3魹山
3鮊岳
3鵃岳
4樿樿山
4高蠃山
4馿海馿ノ峰
4𡴭狼𡴭山
4𡶒石𡶒沢山
4𣘹𣘹原山
4𥓙茶𥓙山
4𥹖𥹖塚
-弰山

この表にある山名でも、代替漢字があるものについては、Shift_JISの時代でも漢字で表記できていたから、本稿で考えている「漢字表記ができなかったため見過ごされていた難読山名」には該当しない(とは言え、瓢簞山など、読みが難しい山名もある)。以下では、代替がある漢字と、拡張文字として使用できた「嵓」の場合を除外し、その他の漢字を含む山名を難読・稀少漢字山名として、少し詳しく述べる。

なお、「山名一覧 on the Web地図」では、山名検索で位置や読みが容易に調べられるほか、'%'をワイルドカードとして前方一致や後方一致、部分一致で検索ができる。例えば、「牛」を含む山名は、検索文字列を'%牛%'とすると検索できる。お試しあれ。

以下の表中の山名は、第3水準の3座(品刕、峨嶁山、大癭ヶ嶽)を除いて、全て三省堂日本山名事典 改訂版(2011年)に掲載されている(山名事典すごい!)。山名事典と地形図の表記が相違する場合は、原則として山名事典に合わせた。

JIS第3水準漢字を含む山名

2020-08-22改訂:萊、屛、嵓、雞の場合を削除し、前朳差岳、橅生、橅峰、茶荃山、荢山を追加。大癭ヶ嶽の位置と標高を修正。)

山名 位置 標高[m] 都道府県 備考
しなしゅう 地図 639 埼玉 二等三角点、点名:品藾ひんしゅう
喇富士とからふじ 地図 979 鹿児島 中之島の御岳おたけの別名。
迦陵伽岡かりょうびんがおか 地図 215 岩手 「迦陵頻伽岡」と表記されることも多い。
おだるやま 地図 1342 長野
さったやま 地図 244 静岡
がろうざん 地図 180 福島 ふくしま市景観100選
差岳えぶりさしだけ 地図 1636 新潟 日本二百名山。「杁差岳」は誤記。
差岳まええぶりさしだけ 地図 1534 新潟
なでお 地図 790 福島 橅と撫を混同した疑いのある山名。
わかぶなやま 地図 630 新潟
三本さんぼんぶなやま 地図 606 新潟 地形図の「三本撫山」は誤記と思われる。
ぶなみね 地図 585 新潟
風呂山かしわぶろやま 地図 713 広島 別名、槲風呂山かしやぶろやま
良山までらさん 地図 295 福岡 麻底良山の別名。頂上に麻氐良布神社がある。
ヶ嶽おおこぶがたけ 地図 659 兵庫
ちゃせんざん 地図 224 島根
おやま 地図 194 島根
とどやま 地図 465 岩手
かしべだけ 地図 599 青森
びしゃごだけ 地図 885 鹿児島

JIS第4水準漢字を含む山名

UTF-8では常用の漢字は3バイトで表されるが、中には4バイトを要するものがある。下表の末尾の5つの山名の赤字(備考のカッコ内にUnicodeのコードポイントを記したもの)がそれである。ソフトウェアによっては、4バイトUTF-8(以下、utf8mb4と略)は取り扱えなかったり、特殊な設定が必要になる場合がある。

山名 位置 標高[m] 都道府県 備考
樿つげやま 地図 935 北海道
たかつぶりやま 地図 933 福島
馿ノ峰とどのみね 地図 474 新潟 海鑪ノ峰の別名。
𡴭おおかみだわさん 地図 928 和歌山 (U+21D2D)別名、狼峠山。
𡶒沢山いしへつりざわやま 地図 792 福島 (U+21D92)
𣘹原山たららやま 地図 1392 長野 (U+23639)
𥓙ちゃうすやま 地図 94 京都 (U+254D9)
𥹖すくもづか 地図 55 鳥取 (U+25E56)鳥取県で最も低い山。

JIS2004外の漢字を含む山名

」はJIS X 0212 補助漢字に含まれていたが、JIS X 0213に入れて貰えなかった。しかし、補助漢字も全てUnicodeに取り込まれているので、UTF-8では使用可能である。

山名 位置 標高[m] 都道府県 備考
やはずやま 地図 484 和歌山

ちなみに、このページを2014年にサポートが終了した古のWindows XPのInternet Explorer 8で試しに閲覧してみたら、utf8mb4の5文字が豆腐になったが、それ以外は正常に表示された。また、メモ帳も(utf8mb4は取り扱えないが)UTF-8の編集・表示が可能であった。XPは結構出来る子だったんだね。お見逸れしていました。まあ結論は、サイトの文字コードはUTF-8にしておけ、ただしutf8mb4には気をつけろ、ということで(^^;)