iBet uBet web content aggregator. Adding the entire web to your favor.
iBet uBet web content aggregator. Adding the entire web to your favor.



Link to original content: https://geoshape.ex.nii.ac.jp/nrct/
『日本歴史地名大系』地名項目データセット | Geoshapeリポジトリ

『日本歴史地名大系』地名項目データセット | Geoshapeリポジトリ

メニュー

  1. 地名項目 一覧
  2. 歴史的地名/現代地名による統合検索 - 歴史的地名/現代地名を対象とした統合検索
  3. 『日本歴史地名大系』行政地名変遷データセット
  4. れきちめ:日本歴史地名統合データベース

概要

『日本歴史地名大系』地名項目データセットは、ジャパンナレッジで公開する平凡社刊行の『日本歴史地名大系』(全50巻)の地名項目と関連情報をまとめたデータセットです。2023年11月現在、地名項目=80,502件を提供しています。

行政地名データセットの全体像については、れきちめ:日本歴史地名統合データベース、あるいは以下のプレスリリースをご覧ください。

  1. 歴史的地名の「行政区画変遷」を大規模オープンデータ化~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~, 国立情報学研究所

(注) 本データベースは、各地名項目に推定した位置情報を付与していますが、この位置情報の精度には改善の余地があります。今後、予算を確保できれば、より高精度な位置情報に更新していく計画です。現時点での位置情報はあくまで初期バージョンのデータですので、精度の限界を認識した上でご利用下さい。

データセット(オープンデータ)

地名項目データセット

地名項目データセット(2024年4月25日版)

ジャパンナレッジ版『日本歴史地名大系』の項目IDに対して、読みや緯度経度を付与したデータセットです。

GeoNLP地名語辞書

地名項目データセットをGeoNLPの地名語辞書形式に変換したデータセットを以下で公開しています。

『日本歴史地名大系』地名項目データセット地名辞書

ライセンス

本データセットは、CC BY 4.0の下に提供されています。

データセットをご利用の際には、以下のようなクレジットを表示して下さい。

『日本歴史地名大系』地名項目データセット (https://geoshape.ex.nii.ac.jp/nrct/)

利用したデータ

日本歴史地名大系 | ジャパンナレッジ

ジャパンナレッジは、株式会社ネットアドバンスが運営するオンライン辞書・事典検索サイトです。ジャパンナレッジに登録されている『日本歴史地名大系』の項目数は15万件以上ですが、本データセットはこのうち行政地名のみ約8万件を対象とします。寺社や遺跡、城跡、荘園など、行政地名以外の項目はデータセットに含まれませんので、ご注意ください。

位置情報の推定

『日本歴史地名大系』では、位置情報は一部の地名にしか付与されていません。そこで、地図から地名の位置を閲覧/検索できるように、本データセットでは地名の位置情報を推定して追加しました。その方法は以下の通りです。

  1. 最初にPython版住所ジオコーダー「jageocoder」を用いて、地名のジオコーディングにより緯度経度を得ます。ただし、『日本歴史地名大系』は数十年前に編集されたものであるため、編集当時の地名を使っても現在のジオコーダーでは解析できない場合があります。そのため、jageocoderが解析できるような地名に変換してジオコーディングを行う場合があります。またjageocoderが返す緯度経度の精度は、jageocoderが参照するデータセットに依存する点にも注意してください。
  2. jageocoderのジオコーディングの精度が低いと考えられる場合は、人間文化研究機構やH-GIS研究会が公開する「歴史地名データ」を参照し、該当する地名があればその緯度経度を使います。ただし、歴史地名データの緯度経度は、地名が指す範囲の中心または代表点ではなく、古地図上に描かれた地名の文字ラベルの中心点となる点に注意してください。

上記の方法は現時点のものです。精度を改善する余地が大きいため、今後も各種資料を精査しながら精度を向上させていきます。現状では、地図上のマーカーの位置が最適でない場合もあるかと思いますが、今後さまざまな精度向上の取り組みを進めていく予定です。

謝辞

  1. 『日本歴史地名大系』地名項目データセットの位置情報は、株式会社平凡社地図出版が整備しました。
  2. 位置情報の推定には、情報試作室の相良毅氏が開発するjageocoderによるジオコーディング、および人間文化研究機構とH-GIS研究会の歴史地名データを参照しました。特に歴史地名データについては、故 桶谷猪久夫先生(大阪国際大学名誉教授)に深くお礼申し上げます。
  3. データの整備を進めるにあたり、その公開にご理解いただいた株式会社ネットアドバンスおよび株式会社平凡社に心より感謝申し上げます。

論文/発表

  1. 北本 朝展, "地名の情報学と歴史地名データベース構想", 月刊「地理」, Vol. 68, No. 11, pp. 48-55, 2023年11月
  2. 北本 朝展, "GeoとNLPをつなぐ地名の情報学", 地理空間情報と自然言語処理勉強会, 2023年7月 (招待講演)
  3. 北本 朝展, "地名の情報学とデータ駆動型研究の展開", 公開シンポジウム「地名標準化の現状と課題:地名データベースの構築と地名標準化機関の設置に向けて」, 2022年12月 (招待講演)

ソーシャルメディア

歴史的地名の大規模オープンデータを公開しました。https://t.co/Im0dFliHqJ

江戸時代の村までさかのぼる、79,502件の行政地名のデータです。平凡社地図出版と協働し、『日本歴史地名大系』の一部をオープン化しました。自分の先祖がどこに住んでいたかなど、地名から探っていくのも面白いですね。 pic.twitter.com/uikx9bNlLs

- Center for Open Data in the Humanities (CODH) (@rois_codh) October 18, 2023

更新情報

2023-11-24
データ処理上の問題で漏れていた全国の地名を追加し、件数が80,439件→80,502件に増えました。
2023-11-09
データ処理上の問題で漏れていた全国の地名を追加し、件数が80,425件→80,439件に増えました。
2023-11-07
データ処理上の問題で漏れていた全国の地名を追加し、件数が80,277件→80,425件に増えました。
2023-10-25
データ処理上の問題で漏れていた北海道の地名を追加し、件数が79,919件→80,277件に増えました。
2023-10-21
データ処理上の問題で漏れていた沖縄県の地名を追加し、件数が79,552件→79,919件に増えました。
2023-10-20
データ処理上の問題で漏れていた沖縄県の地名を追加し、件数が79,502件→79,552件に増えました。
2023-10-18
『日本歴史地名大系』行政地名変遷データセットを公開しました。件数は79,502件です。