※研究資料の閲覧利用は、事前の申し込みが必要です。詳しくは「研究資料室の利用について」をご覧ください。

最終更新:2017/10/19

資料群ID(fond番号)
Reference code
fo0108
表題
Title
電子計算機による言語処理に関する基礎的研究
概要
Description
日本語の電子計算機処理における諸問題に対する基礎的調査にあたって作成された資料。
配架位置
Location of material
中央資料庫,中央メディア保管庫
公開年月日
Date of release
2017/03/24
資料群に含まれる資料の年代
Dates of creation of the material in the unit of description
数量・形態
Extent of the unit of description
保存箱9箱,マイクロフィルム(フィッシュ)1665枚
資料作成者
Name of creator
[昭和45-48年度]国立国語研究所第四研究部第一資料研究室:田中章夫(室長),江川清,中野洋,靏岡昭夫。【協力】第四研究部言語計量調査室:石綿敏雄(室長),斎藤秀紀,村木新次郎,米田正人。【研究補助】益子芳江,堀江久美子,紺野雅子,林実知代,岡田敏子,竹内純子,田島道子,小高京子,白木千夏,沢村都喜江,下山いくよ。[昭和49年度]言語計量研究部第一研究室:田中章夫(室長),中野洋,靏岡昭夫。【協力】同第二研究室:土屋信一(室長),野村雅昭。同第三研究室:石綿敏雄(室長),斎藤秀紀,米田正人。【研究補助】岡田敏子,田島(武田)道子,白木千夏,堀江久美子,小高京子,沢村都喜江,下山いくよ,竹内純子。
資料作成組織の履歴
Administrative / Bibliographical history
1.研究目的
電子計算機を使用した日本語のデータ処理に関する諸問題(同音語の処理,同形の文字列,漢字かな混じり文の処理など)を研究するため,基礎的な資料を作成する。それに基づいて「日本語の電子計算機処理の基礎理論(アルゴリズム)」とその問題点を洗い出し,検討する。

2.担当者
第四研究部第一資料研究室。協力:第四研究部言語計量調査室。

3.研究経過
昭和45年度:「言語単位分割」「品詞認定」「活用形処理」「漢字解読」などを自動化するプログラム・システムを構築。

昭和46年度:次の研究に着手。
(1)語句の構造と相互連接に関する調査研究
(2)文字の連続確立(エントロピー)調査
(3)KWICシステム(文脈つき用語索引):語彙索引の作成用プログラム「COBOL-KWIC」(石綿敏雄作成)と漢字データ専用の漢字テレタイプKWIC(「漢テレKWIC」)のあとを受け,カタカナ入力専用のシステム実験。

昭和47年度:入力データの言語単位・付加情報(品詞・活用等)の検討や,入力データのチェックシステムの開発が進めれた。
この他に,活用形の自動処理法の研究などが行なわれ,検索処理の実験を試み,また検索結果を分析。 これらの調査研究の成果は『電子計算機による国語研究』Ⅲ・Ⅳ・Ⅴ(1972)に公表された。
以上のほかに文部省科学研究費補助金(試験研究費)による「電子計算機による総合語彙表作成のための基礎的研究」(研究代表者:岩淵悦太郎)として,既製の用語索引12種および分類語彙表の入力データの作成を行い,近世の言語資料『浮世風呂』『心中天網島』のKWICを作成。

昭和48年度:用語検索システムのメインルーチンを完成。出力プログラムとして,漢字ラインプリンタ用編集・出力プログラムを作成。本システムを用い,森鴎外「寒山拾得」の漢字かな混じり文用語索引を作成。また,前年に取得した科研費により,既製の用語索引12種および分類語彙表の入力データ作成を行い,『浮世風呂』『浮世床』『今昔物語集』KWICを作成。これらは,日本語の大量データ出力のための実験である。 また,本年度の調査・研究成果を『電子計算機による国語研究』Ⅵ(1973),『ことばの研究』4・5(国立国語研究所論集4・5)に公表された。

昭和49年度:文部省科学研究費補助金「作品の用語検索組織の研究」(代表:石綿敏雄)として,用語検索システムの開発研究および近代語の資料として,山田美妙『武蔵野』・坪内逍遥『当世書生気質』KWICを作成。
資料作成年月日
Dates of accumulation of the material in the unit of description
1970-1974
管理歴
Custodial history
西が丘第一資料庫より,立川移転時に中央資料庫へ移管。
入手情報
Immediate source of acquistion
資料内容
Scope and content / Abstract
電子計算機によってデータ出力された各種KWIC台帳類。ならびに語彙調査の研究資料が中心となる。
・語形索引バインダー:「浮世風呂」「浮世床」「遊子方言」「当世書生気質」ほか。
・マイクロフィッシュ版KWIC:「浮世風呂」「浮世床」
・「今昔物語集」巻26・30索引
・格助詞,助詞バインダー
・語彙調査用プログラムリスト
・コンバート済みデータ
・図書資料扱いのKWIC台帳(請求記号:099/Ko49):「今昔物語集」「浮世風呂」「当世書生気質」「遊子方言」「心中天網島」「城の崎にて」など。
評価・廃棄
Appraisal, destruction and scheduling information
追加受入
Accruals
利用条件
Access conditions
複写条件
Copyright / Conditions governing reproduction
資料使用言語
Language of material
日本語
物理的特徴
Physical charactristics
検索手段
Finding aids
オリジナル資料の存在
Location of originals
 複製の存在
Existence of copies
関連調査・研究
Associated material
fo0103「漱石・鴎外の用語の研究」
成果刊行物(DB等含む)
Publication note
『昭和45年度国立国語研究所年報22』(1971)
『昭和46年度国立国語研究所年報23』(1972)
『昭和47年度国立国語研究所年報24』(1973)
『昭和48年度国立国語研究所年報25』(1974)
国立国語研究所編『電子計算機による国語研究Ⅲ』(国立国語研究所報告39,1971)
国立国語研究所編『電子計算機による国語研究Ⅳ』(国立国語研究所報告46,1972)
国立国語研究所編『電子計算機による国語研究Ⅴ』(国立国語研究所報告49,1973)
国立国語研究所編『電子計算機による国語研究Ⅵ』(国立国語研究所報告51,1974)
国立国語研究所編『志賀直哉『城の崎にて』用語索引: 電子計算機による用例表作成の一実験』(国立国語研究所,1971)
備考
Note
移管年月日
Reference code
2004/09/30
移管者名
Name of applicant
米田純子
記述作成年月日
Date of record
2009/02/03
記述作成者
Name of recorder
寺島宏貴,森本祥子
記述言語
Language of record
日本語