熊本大学とTOPPAN、くずし字AI-OCRを活用した古文書の大規模調査のための独自手法を開発
【概要説明】
国立大学法人 熊本大学(所在地:熊本県熊本市、学長:小川久雄、以下熊本大学)とTOPPAN ホールディングスのグループ会社であるTOPPAN 株式会社(本社:東京都文京区、代表取締役社長:齊藤昌典、以下 TOPPAN)は、熊本大学が公益財団法人永青文庫から寄託を受けている歴史資料『細川家文書(ほそかわけもんじょ)』のうち、専門家でも解読が困難な難易度の高いくずし字で書かれた約5 万枚の未解読の古文書(藩政記録)をAI-OCR を用いて短期間で解読し、約950 万文字のテキストデータを生成することに成功しました。
さらに、くずし字資料の解読システムと連動するキーワード検索システムを構築することにより、江戸時代前期の細川藩領国(小倉領40 万石から熊本領54 万石)の、約90年間にわたるあらゆる社会的事件や統治制度の変容を示す記述を含んだ資料を即時に検索収集できるようになりました。
今回解読した古文書は、『細川家文書』のうち、細川家奉行所の執務記録である「奉行所日帳(ぶぎょうしょにっちょう)」、藩主細川忠利の口頭での命令を日次に記録した「奉書(ほうしょ)」、参勤中の細川藩主が国元の家老・奉行衆に発した書状の控えである「御国御書案文(おくにごしょあんもん)」、小倉・熊本の惣奉行衆から各業務を担当する奉行たちへ発せられた指示書類の控えである「方々(かたがた)への状控(じょうひかえ)」など、合計約5万枚です。
また、くずし字AI-OCRにより作成したテキストデータに対して、今回「地震、大雨、洪水、虫、飢、疫」などの災害に関連するキーワードで検索・調査を実施したところ300 件以上の記述を発見しました。その中には、知られざる自然災害、疫病流行や飢饉など、歴史学・地域防災研究において重要な資料も含まれます。
今後、熊本大学とTOPPAN は、『細川家文書』の解読と分析を進め、江戸時代の社会史研究の通時的深化に貢献するとともに、新しく発見された災害関連の記録を活用することで、現代における防災意識の醸成、防災計画の策定等にも活用を目指します。
【今後の展開】
今後、熊本大学およびTOPPAN は、共同で『細川家文書』を解読し、当研究を通じて現代における防災計画や、歴史学の学習・研究の拡大に貢献します。
熊本大学は、『細川家文書』の解読と分析を進め、一時代の中でも細分化された短期間の枠内で完結するような研究法を克服して、江戸時代の長期にわたる社会変容の過程を通時的に把握し、九州に基点をすえた江戸時代社会史研究の深化に取り組んでいきます。
また、TOPPAN はグループ会社であるTOPPAN デジタル、TOPPANエッジとも連携し、AI-OCRによる古文書解読支援システム「ふみのは®」の精度向上を目指すとともに、全国の様々な教育機関、博物館・資料館、地方自治体などと提携し、全国各地に眠る貴重な歴史的資料の研究・活用の支援に取り組んでいきます。
【詳細】プレスリリース(PDF444KB)
お問い合わせ
熊本大学永青文庫研究センター
担当:(センター長、教授)稲葉 継陽
電話:096-342-2304
E-mail:inaba※kumamoto-u.ac.jp
(迷惑メール対策のため@を※に置き換えております)