帝国議会会議録検索システムで全期間の本文テキストデータが利用できるようになりました
国立国会図書館は、帝国議会会議録検索システムにおいて、帝国議会の速記録の画像データを公開しています。令和6年8月23日、戦前・戦中期分(明治23(1890)年11月~昭和20(1945)年8月)の速記録の画像データ(合計約27万ページ)からOCR(光学的文字認識)処理により作成した本文テキストデータを、新たに公開しました。
これにより、既に本文テキストデータを提供している戦後期分(昭和20(1945)年9月~昭和22(1947)年3月)と合わせて、帝国議会の全期間にわたり、速記録に掲載された質疑や議案本文などの全文検索とテキスト表示ができるようになりました。ぜひご利用ください。
なお、今回公開した戦前・戦中期分の本文テキストデータは、人手による校正を行った戦後期分と異なり、OCR処理による文字の認識間違い(誤字・脱字)や認識不能を意味する文字「〓(ゲタ文字)」があり、検索や表示(発言単位の切り分け)が正確に行えない場合があります。これらについては、公開後もデータ整備を行ってまいります。
- 問い合わせ先
-
国立国会図書館 調査及び立法考査局 議会官庁資料課 立法情報係
電話(代表):03-3581-2331(内線:21630)