※研究資料の閲覧利用は、事前の申し込みが必要です。詳しくは「研究資料室の利用について」をご覧ください。

最終更新:2017/10/20

資料群ID(fond番号)
Reference code
fo0096
表題
Title
高校・中学校教科書の語彙調査
概要
Description
高校・中学校教科書で使用されている語彙についての調査・研究資料。調査材料となった中高教科書,データ分析資料等。
配架位置
Location of material
中央資料庫,中央メディア保管庫
公開年月日
Date of release
2017/03/24
資料群に含まれる資料の年代
Dates of creation of the material in the unit of description
数量・形態
Extent of the unit of description
保存箱38箱,磁気テープ25本,FD136枚, マイクロフィルム(フィッシュ)196枚,(ファイル44冊 未確認)
資料作成者
Name of creator
【高校教科書の語彙調査】国立国語研究所言語計量研究部・部長:斎賀秀夫。第一研究室:土屋信一,中野洋,靏岡昭夫。第二研究室:野村雅昭,佐竹秀雄。第三研究室:斎藤秀紀,田中卓史。その他:石綿敏雄,田中章夫,米田正人,大滝弘美,岡田敏子,小沢(長田)厚子,小高京子,沢村都喜江,科野(白木)千夏,下山いくよ,田島(武田)道子,中俣(堀江)久美子,松浦(小原)美恵子,山口和子,米田(竹内)純子。

【中学校教科書の語彙調査】同・言語計量研究部・部長:野村雅昭。第一研究室:中野洋,石井正彦,山崎誠。第二研究室:靏岡昭夫,佐竹秀雄。第三研究室:斎藤秀紀,田中卓史。他:小沢厚子,小高京子,小沼悦,沢村都喜江,下山いくよ,中俣久美子,原田和子,松浦美恵子,米田純子。

【語彙調査自動化の基礎的研究】同・言語計量研究部第一研究室・部長:野村雅昭。室長:中野洋。主任研究官:靏岡昭夫。研究員:山崎誠,石井正彦。研究補助員:山口和子,小沼悦。

【分析データ公開用メディアの作成】言語体系研究部第2研究室:中野洋,山崎誠,小沼悦。
資料作成組織の履歴
Administrative / Bibliographical history
Ⅰ.高校・中学校教科書の語彙調査
[調査の目的]
現代日本語の用字・用語の実態を明らかにするために,国立国語研究所では,新聞,婦人雑誌,総合雑誌,雑誌90種,新聞三紙を対象として語彙調査を重ねてきた。
これらの調査研究の後を受け,一般教養,また大学教育の基礎として各分野の専門知識のための語彙を明らかにすることを目的として,高校教科書の語彙調査を実施した。さらに,その後を受けて中学校教科書の語彙調査を実施した。
高校・中学校教科書の語彙調査・研究の目標は,専門知識体系を記述する語彙・表記・表現の実態を把握・分析することである。従来のサンプリング法によらず,対象とする文章を限定したのち,その全文を入力するという方法を採った。この方法により,これまでの語彙調査では出来なかった文章解析などの分析と記述を行った。
以下(1)-(3)では,実施された各調査の概要を述べる。

(1)高校教科書の語彙調査
 この調査研究は昭和49-54年度に「高校教科書の用字・用語調査」として実施された。調査の目的は,国民の一般教養または大学教育の基礎として,各分野の専門知識を身につける時に必要な語彙の実態を明らかにすることである。
 調査対象は,昭和49年当時に使用されていた高等学校教科書のうちの,社会科・理科の全教科のうちから,次の9教科とした。
理科:物理Ⅰ・化学Ⅰ・生物Ⅰ・地学Ⅰ
社会:倫理社会・政治経済・日本史・世界史・地理B
(2)中学校教科書の語彙調査
この調査研究は昭和55-57年度に「教科書および文章表現に関する調査研究」として実施された。これまでの調査研究,特に高校教科書の語彙調査の後に続いている。高校教科書の調査結果の集計・分析の段階で,現在の教科書における難解な表現が問題点として残された。そこで,義務教育の最終段階である中学校の教科書の用語および文章表現を調査し,高校教科書と比較・検討を行った。
 調査対象は,昭和55年当時に使用されていた中学校教科書のうち,社会科・理科の全教科の中から,次の7教科とした。
理科…理科1上・理科1下・理科2上・理科2下
社会…歴史・地理・公民

Ⅱ.語彙調査自動化のための基礎的研究
(1) 調査の目的
 これまでに開発された電子計算機を用いた語彙調査システムは,きめ細かい調査・分析ができるようになったものの,自動処理及び調査結果の管理運用方法などについては十分ではない。そこで,これらを目標とした新しい語彙調査システムを開発する。
 具体的には次の4点について,研究開発・調査分析を進める。
  1 自動処理プログラムの開発
  2 効率的な修正システムの開発
  3 調査結果の蓄積・検索・分析方法の開発,及びその運用方法の研究
  4 新しい電子計算機・日本語処理システムの調査研究
(2) 教科書語彙調査との関連
 昭和59-62年度の研究は,次のA・Bである。
A 語彙調査自動化のための準備的研究
B これまで行われてきた中学校教科書及び高校教科書の語彙調査の実施とまとめ
 ここでは,記述の対象である資料群との関係上,Bに限定して述べる。 
 中学教科書の語彙調査は社会科・理科教科書本文の全数調査であった。この調査は高校教科書調査より自動化が図られている。すなわち,入力段階では読み仮名等の情報を省き,高校教科書のデータを辞書として読み仮名・代表形を自動的に付ける。そののち,検査を行い,情報の付かなかった個所・情報の違っている個所のみに,人手による修正を行った。
 このような作業のうえで,中学校教科書のW・M単位語彙表の作成,高校教科書の用語の分析およびその効果的な分析プログラムの作成を行った。語彙表は成果報告書に収載された(下記Ⅴを参照のこと)。

Ⅲ.調査担当者
上記の各調査は,特別研究「言語計量調査」として,言語計量研究部に属する三研究部が共同で行った。また,データ公開作業(平成5年度)は言語体系研究部が行った。具体的な担当課と担当者名は,下記「資料作成者」の通りである。

Ⅳ.調査の手順
以下1-16は,「教科書の語彙調査」と「語彙調査の自動化の研究」を合わせた作業全体の流れである。
1.計画の立案:調査の目的・対象・分析事項の検討と決定。調査単位・調査システムの決定。作業分担の決定。なお調査単位は,文節から助辞を切り出した「W単位」と,それよりも小さく形態素に近い「M単位」の二種類に決定。
2.資料の収集
3.入力データ作成
(1)作業台帳の作成,対象とする個所の指定
(2)文・段落等の情報の記入
(3)単位切り・その検査
(4)清書・その検査・・・清書の際,読み仮名,代表形(同じ語としてまとめられた一群の語の,代表である語形のこと。語についての使用率がどれほどか,異なり語数が幾らになるかを論ずる際の単体を表すもの),助辞,振り仮名情報を付ける。
(5)データ鑽孔(一部分は外注)
4.機械処理・・・データの機械読み込み,機械的チェック,漢字プリンター出力印字(入力データ形式)
5.検査・校正・・・修正データ作成,鑽孔,修正機械処理を含む。
6.機械処理 修正検査用ミニKWIC(文脈つき用例索引のこと。M単位・W単位の二種がある)および教科書の原文形式の出力
7.ミスデータの検出と修正 修正データ作成,鑽孔,修正機械処理を含む
8.同語異語判別作業用KWIC作成
9.同語異語判別作業
10.付加情報つけ 語種・人名地名等の情報,分類語彙表の意味番号,見出し表記形の選択,注記としての情報記入など。意味番号・見出し表記形つけは,機械的に付したものを点検・修正する。
11.最終ファイル作成
12.語彙表作成・印字(全体・教科別,五十音順・度数順など)
13.各種集計・分析表作成
14.用例表(KWIC)作成
15.手順12-14その他を用いた分析・記述,報告書の作成・刊行
16.手順11を用いた各種実験・分析

[調査単位と長さ] 
国語研究所では昭和41年から行われた新聞の語彙調査に電子計算機を使用し,長短ニ種の調査単位を採用した。その理由は,電子計算機を用いて処理を行えば手作業ほど労力はかからないこと,語の構造を明らかにできて造語要素の使用状況についての資料が得られること,などである(国語研究所報告37「電子計算機による新聞の語彙調査」等)。 以後の大規模な調査の多くは,複数の言語単位を用いて行われている。
今回の調査では,それらの各調査の経験をふまえ,また,高校の社会科・理科の教科書という文章の性格を考慮に入れ,新たに決めた長短2種類の単位を用いた。 長い単位は,文の構成にあずかる要素(いわゆる文節)にもとづく単位で,wordの頭文字をとって「W単位」と名付けた。 短い単位は,語の構成にあずかる要素(いわゆる最小単位)にもとづく単位で,morphemeの頭文字をとって「M単位」と名付けた。また,単位切りの段階では,句読点その他の記号類も,一般の言葉と同等に扱っているが,それは単位切り作業と,それに続く一連の機械処理を的確かつ迅速に行うためであり,最終出力段階では別途に集計されている。
単位切り作業の手順:①まず教科書原本の文章をW単位で切る(赤い“/”を入れる)②W単位をM単位に分ける。
なお,W単位・M単位を決定するまでの経緯,W単位の詳細については,靏岡昭夫「高校教科書調査の言語単位について」『電子計算機による国語研究Ⅹ』(国立国語研究所報告67)に報告されている。

Ⅴ.データ公開用メディアの作成
平成5年度に実施。教科書の語彙調査の成果報告書(下記Ⅵ「成果刊行物」を参照のこと)に収載された語彙表のデータ化・公開作業。

Ⅵ.成果刊行物
詳細は上記「関連出版物」の項目を参照のこと。
(1)成果報告書
高校教科書の調査:『高校教科書の語彙調査』(1983),『同』Ⅱ(1984),『高校教科書文脈付き用語索引』[マイクロフィッシュ版](1985)が刊行された。
中学校教科書の調査:「語彙調査自動化の研究」の報告書を兼ねて,『中学校教科書の語彙調査』(1986),『同』Ⅱ(1987),『高校・中学校の語彙調査―分析編』(1989)が刊行された。
(2)データ公開用メディア
『中学校・高校教科書の語彙調査』[フロッピー版](1994):上記報告書に掲載されている語彙表をそのまま3.5インチFDに移し,コンピュータによる利用を可能にしたもの。
資料作成年月日
Dates of accumulation of the material in the unit of description
1974-1993
管理歴
Custodial history
国立国語研究所研究開発部門第一領域より,中央資料庫へ移管。
入手情報
Immediate source of acquistion
資料内容
Scope and content / Abstract
高校・中学校教科書の語彙調査に関する調査・分析資料。ならびに,上記「語彙調査自動化の基礎的研究」において作成された分析資料(成果報告書用)を含む。
評価・廃棄
Appraisal, destruction and scheduling information
追加受入
Accruals
利用条件
Access conditions
個人情報は原則として非公開。
複写条件
Copyright / Conditions governing reproduction
個人情報は複写不可。
資料使用言語
Language of material
日本語
物理的特徴
Physical charactristics
検索手段
Finding aids
オリジナル資料の存在
Location of originals
 複製の存在
Existence of copies
関連調査・研究
Associated material
成果刊行物(DB等含む)
Publication note
『国立国語研究所報告』26-36・38・39 1974-1984・1986・1987
靏岡昭夫「高校教科書調査の言語単位について」『電子計算機による国語研究Ⅹ』(国立国語研究所報告67,1980)
国立国語研究所編『高校教科書の語彙調査』(国立国語研究所報告76,秀英出版,1983)
国立国語研究所編『高校教科書の語彙調査Ⅱ』(国立国語研究所報告81,秀英出版,1984)
国立国語研究所編『中学校教科書の語彙調査』(国立国語研究所報告87,秀英出版,1986)
国立国語研究所編『中学校教科書の語彙調査』Ⅱ(国立国語研究所報告91,秀英出版,1987)
『データ集・高校教科書文脈付き用語索引』(国立国語研究所言語処理データ集1,[マイクロフィッシュ5本と解説書],日本マイクロ写真,1985)
国立国語研究所編『高校・中学校の語彙調査―分析編』(国立国語研究所報告99,秀英出版,1989)
国立国語研究所編『中学校・高校教科書の語彙調査』(国立国語研究所データ集6,[3.5インチフロッピーディスク2枚と解説書],秀英出版,1994)
備考
Note
移管年月日
Reference code
2004/10/01
移管者名
Name of applicant
山崎誠
記述作成年月日
Date of record
2008/09/10
記述作成者
Name of recorder
寺島宏貴,森本祥子
記述言語
Language of record
日本語