難読・稀少漢字山名
難読山名の全国1位は大分県の日田市と中津市の境にある一尺八寸山で、「いっしゃくはっすんやま」ではなく、何と「みおうやま」と読むそうである。これは1996年、パソコン通信のフォーラム(今は亡きNIFTY-Serve FYAMA)で開催された日本異様難読山名コンテストにおいて投票で選定されたもので、難読山名ベスト20(20位が2座あるので計21座)は次の表の順となっている(参考:大竹美緒子著『山の名前っておもしろい!』)。
山名 | 位置 | 標高[m] | 都道府県 | 備考 |
---|---|---|---|---|
一尺八寸山 | 地図 | 707 | 大分 | 1位。 |
爺爺岳 | 地図 | 1822 | 北海道 | 2位。北方領土の最高峰。 |
月出山岳 | 地図 | 709 | 大分 | 3位。 |
雲母峰 | 地図 | 888 | 三重 | |
岨巒堂山 | 地図 | 751 | 新潟 | |
阿哲台 | 地図 | ※1 | 岡山 | ※1 標高500m前後のカルスト台地。 |
梅花皮岳 | 地図 | 2000 | 山形、新潟 | |
本富岳 | 地図 | 940 | 鹿児島 | モッチョム岳の別名。 |
鰻轟山 | 地図 | 1046 | 徳島 | |
後方羊蹄山 | 地図 | 1898 | 北海道 | 日本百名山。羊蹄山の別名。 |
設計山 | 地図 | 702 | 北海道 | |
万年山 | 地図 | 1140 | 大分 | |
父不見山 | 地図 | 1047 | 群馬、埼玉 | ててみずやま、ててみえじやまとも読む。 |
山毛欅潰山 | 地図 | 898 | 山形 | |
皇海山 | 地図 | 2144 | 栃木、群馬 | 日本百名山。 |
子檀嶺岳 | 地図 | 1223 | 長野 | |
光岳 | 地図 | 2592 | 長野、静岡 | 日本百名山。 |
大根下山 | 地図 | 1083 | 福島 | |
行縢山 | 地図 | 830 | 宮崎 | |
犢牛岳 | 地図 | 690 | 福岡 | |
天狗角力取山 | 地図 | 1360 | 福島 |
このコンテストが行われた1996年はWindows 95の時代で、文字コードはShift_JIS、パソコンで扱える漢字はJIS X 0208の第1、第2水準漢字にNEC選定IBM拡張文字を加えたものが事実上の標準であった。上記の難読山名はどれもShift_JISで表示できるが、山名などの固有名詞には用例が稀少でShift_JISにない漢字が含まれることが多々あり、文書やウェブページに漢字で表示することが難しかった山名がある。
(注:正確には拡張文字を加えた文字コードはCP932と呼ばれるが、ウェブページで指定する際はShift_JISでもCP932でも表示は多分同じである。)
一例を挙げると、飯豊連峰の朳差岳は日本二百名山の一座なので出現頻度が高い山名であるが、「朳」はShift_JISにないので、文書ならば外字を作る、ウェブページならば画像化する、あるいは諦めて「えぶり差岳」とひらがなで表記するしかない。また、第2水準漢字に見た目が良く似た「杁」があるため、杁差岳と誤記されたケースも多く、現在もググると大量にヒットする。朳(えぶり)は土をならす農具で、横木にのこぎり状の歯がついていないもの、杁(いり)は氏名や地名に用いる国字で、両者は本来的に別の漢字である。
なお、燧ヶ岳の最高峰の柴安嵓も日本百名山の一座で出現頻度が高く、かつ第1、第2水準漢字にない「嵓」を含む山名であるが、「嵓」は幸いNEC選定IBM拡張文字に含まれていたので、これは問題なく表示できた。
その後、JIS X 0208に第3、第4水準漢字を加えたJIS X 0213が2000年に制定され、2003年にUnicode 3.1がJIS X 0213を正式サポート、2004年にはJIS X 0213が改定されてJIS X 0213:2004(通称、JIS2004)となり、Windows Vistaから対応フォント(メイリオ、MS明朝、MSゴシック)が標準装備されるようになった。
(2018-07-29追記:また、JIS2004に対応したフリーなフォントとしては、情報処理推進機構が公開しているIPAexフォントがある。)
文字コードにUTF-8を用いれば、JIS2004の第1水準、第2水準、第3水準、第4水準をフル活用することが可能となり、漢字が表示できなくて困るケースはほぼなくなった。
(注:HTMLではUnicodeの文字を数値文字参照で記述することができ、Shift_JISのページでも朳(UnicodeコードポイントU+6733)は「朳」と表記できる。もちろん、閲覧する側に対応フォントが普及して、初めて役立つようになった方法である。)
ウェブページの作成では、GoogleがUnicodeの全文字に対応したGoogle Noto Fontsを開発してオープンソースで公開しており、2014年7月にNoto Sans CJK(日中韓サンセリフ書体)、2017年4月にNoto Serif CJK(日中韓明朝体)がリリースされている。なお、Notoとはno more tofuの意味とか(^^)。Noto フォントはウェブフォントとしても利用でき、ブラウザ側にフォントがない漢字でも表示可能となる。
このページは当然、UTF-8で記述され、さらに要所でNotoフォントをウェブフォントとして利用しているので、サポートが終了したレガシーブラウザでなければ、豆腐(表示できない文字の代わりの□)は出ないはずである。
JIS2004とUTF-8を活用できる環境が広く普及した結果、ウェブサイトの文字コードはUTF-8が大半を占めるようになった(2017年10月のINTERNET Watchの「ウェブサイトにおける文字コードの割合、UTF-8が90%超え。Shift_JISやEUC-JPは?」の記事)。
(2020-03-07追記:Microsoftも「Windows と日本語のテキストについて」という文書を公開して、Shift_JISからUTF-8への移行を推奨している。)
ここまでが前置きで、技術的な説明が大変長くなった。そんな訳で、Shift_JISが主流の時代に行われた難読山名コンテストでは、表示が困難で見過ごされていたであろう第3、第4水準漢字(=稀少漢字)を含む山名(見たことがないような漢字を含むので、必然的に難読山名となる)にはどんなものがあるかな、と調べてみたところと、稀少地名漢字リストというサイトを発見。第3、第4水準の漢字毎に地名の実例が挙げられている。
2020-08-22改訂:今回、「山名一覧 on the Web地図」に収録している約20,000座の山名を全数調べて、第3、第4水準の漢字を含む山名を抽出した。次表にその結果を示す。ここで、当該の漢字に第1、第2水準の異体字がある場合は、それを「代替」の欄に示した。表中の文字色は常用漢字、印刷標準字体、簡易慣用字体を表す。異体字がある場合、使用する漢字は常用漢字と印刷標準字体から選ぶのが現代の標準である。
2022-12-22改訂:朳山を追加。
水準 | 漢字 | 代替 | 山名 |
---|---|---|---|
3 | 刕 | 品刕 | |
3 | 剝 | 剥 | 白剝山、剝岳、切剝山 |
3 | 吞 | 呑 | 水吞場山、吞岡山、水吞山 |
3 | 噶 | 吐噶喇富士 | |
3 | 嚙 | 噛 | 嚙伊尻 |
3 | 嚬 | 迦陵嚬伽岡 | |
3 | 埵 | 男埵山、薩埵山 | |
3 | 屛 | 屏 | 屛山、屛風山、屛風岳、屛風ノ耳、屛風ノ頭、屛風岩山、屛風立山、南屛風岳 |
3 | 嵓 | 嵓倉山、俎嵓、白嵓、竜嵓山、白嵓ノ頭、赤嵓北峰、柴安嵓、向赤松嵓 | |
3 | 嶁 | 峨嶁山 | |
3 | 摑 | 掴 | 大摑山 |
3 | 朳 | 朳差岳、前朳差岳、朳山 | |
3 | 橅 | 橅生、若橅山、三本橅山、橅峰 | |
3 | 檞 | 檞風呂山 | |
3 | 氐 | 麻氐良山 | |
3 | 癭 | 大癭ヶ嶽 | |
3 | 簞 | 箪 | 瓢簞山、大瓢簞山、瓢簞崩山 |
3 | 荃 | 茶荃山 | |
3 | 荢 | 荢山 | |
3 | 萊 | 莱 | 蓬萊山、薬萊山、蓬萊尾山、東蓬萊山 |
3 | 蟬 | 蝉 | 蟬ヶ岳、蟬山、蟬倉山、蟬峠山 |
3 | 雞 | 鶏 | 雞足山 |
3 | 魹 | 魹山 | |
3 | 鮊 | 鮊岳 | |
3 | 鵃 | 鵃岳 | |
4 | 樿 | 樿山 | |
4 | 蠃 | 高蠃山 | |
4 | 馿 | 海馿ノ峰 | |
4 | 𡴭 | 狼𡴭山 | |
4 | 𡶒 | 石𡶒沢山 | |
4 | 𣘹 | 𣘹原山 | |
4 | 𥓙 | 茶𥓙山 | |
4 | 𥹖 | 𥹖塚 | |
- | 弰 | 弰山 |
この表にある山名でも、代替漢字があるものについては、Shift_JISの時代でも漢字で表記できていたから、本稿で考えている「漢字表記ができなかったため見過ごされていた難読山名」には該当しない(とは言え、瓢簞山など、読みが難しい山名もある)。以下では、代替がある漢字と、拡張文字として使用できた「嵓」の場合を除外し、その他の漢字を含む山名を難読・稀少漢字山名として、少し詳しく述べる。
なお、「山名一覧 on the Web地図」では、山名検索で位置や読みが容易に調べられるほか、'%
'をワイルドカードとして前方一致や後方一致、部分一致で検索ができる。例えば、「牛」を含む山名は、検索文字列を'%牛%
'とすると検索できる。お試しあれ。
以下の表中の山名は、第3水準の4座(品刕、峨嶁山、朳山、大癭ヶ嶽)を除いて、全て三省堂日本山名事典 改訂版(2011年)に掲載されている(山名事典すごい!)。山名事典と地形図の表記が相違する場合は、原則として山名事典に合わせた。
JIS第3水準漢字を含む山名
(2020-08-22改訂:萊、屛、嵓、雞の場合を削除し、前朳差岳、橅生、橅峰、茶荃山、荢山を追加。大癭ヶ嶽の位置と標高を修正。)
(2022-12-22改訂:朳山を追加。)
山名 | 位置 | 標高[m] | 都道府県 | 備考 |
---|---|---|---|---|
品刕 | 地図 | 639 | 埼玉 | 二等三角点、点名:品藾 |
吐噶喇富士 | 地図 | 979 | 鹿児島 | 中之島の御岳の別名。 |
迦陵嚬伽岡 | 地図 | 215 | 岩手 | 「迦陵頻伽岡」と表記されることも多い。 |
男埵山 | 地図 | 1342 | 長野 | |
薩埵山 | 地図 | 244 | 静岡 | |
峨嶁山 | 地図 | 180 | 福島 | ふくしま市景観100選 |
朳差岳 | 地図 | 1636 | 新潟 | 日本二百名山。「杁差岳」は誤記。 |
前朳差岳 | 地図 | 1534 | 新潟 | |
朳山 | 地図 | 84 | 福岡 | 遠賀郡水巻町えぶりにある。 |
橅生 | 地図 | 790 | 福島 | 橅と撫を混同した疑いのある山名。 |
若橅山 | 地図 | 630 | 新潟 | |
三本橅山 | 地図 | 606 | 新潟 | 地形図の「三本撫山」は誤記と思われる。 |
橅峰 | 地図 | 585 | 新潟 | |
檞風呂山 | 地図 | 713 | 広島 | 別名、槲風呂山。 |
麻氐良山 | 地図 | 295 | 福岡 | 麻底良山の別名。頂上に麻氐良布神社がある。 |
大癭ヶ嶽 | 地図 | 659 | 兵庫 | |
茶荃山 | 地図 | 224 | 島根 | |
荢山 | 地図 | 194 | 島根 | |
魹山 | 地図 | 465 | 岩手 | |
鮊岳 | 地図 | 599 | 青森 | |
鵃岳 | 地図 | 885 | 鹿児島 |
JIS第4水準漢字を含む山名
UTF-8では常用の漢字は3バイトで表されるが、中には4バイトを要するものがある。下表の末尾の5つの山名の赤字(備考のカッコ内にUnicodeのコードポイントを記したもの)がそれである。ソフトウェアによっては、4バイトUTF-8(以下、utf8mb4と略)は取り扱えなかったり、特殊な設定が必要になる場合がある。
山名 | 位置 | 標高[m] | 都道府県 | 備考 |
---|---|---|---|---|
樿山 | 地図 | 935 | 北海道 | |
高蠃山 | 地図 | 933 | 福島 | |
海馿ノ峰 | 地図 | 474 | 新潟 | 海鑪ノ峰の別名。 |
狼𡴭山 | 地図 | 928 | 和歌山 | (U+21D2D)別名、狼峠山。 |
石𡶒沢山 | 地図 | 792 | 福島 | (U+21D92) |
𣘹原山 | 地図 | 1392 | 長野 | (U+23639) |
茶𥓙山 | 地図 | 94 | 京都 | (U+254D9) |
𥹖塚 | 地図 | 55 | 鳥取 | (U+25E56)鳥取県で最も低い山。 |
JIS2004外の漢字を含む山名
「弰」はJIS X 0212 補助漢字に含まれていたが、JIS X 0213に入れて貰えなかった。しかし、補助漢字も全てUnicodeに取り込まれているので、UTF-8では使用可能である。
山名 | 位置 | 標高[m] | 都道府県 | 備考 |
---|---|---|---|---|
弰山 | 地図 | 484 | 和歌山 |
ちなみに、このページを2014年にサポートが終了した古のWindows XPのInternet Explorer 8で試しに閲覧してみたら、utf8mb4の5文字が豆腐になったが、それ以外は正常に表示された。また、メモ帳も(utf8mb4は取り扱えないが)UTF-8の編集・表示が可能であった。XPは結構出来る子だったんだね。お見逸れしていました。まあ結論は、サイトの文字コードはUTF-8にしておけ、ただしutf8mb4には気をつけろ、ということで(^^;)