※研究資料の閲覧利用は、事前の申し込みが必要です。詳しくは「研究資料室の利用について」をご覧ください。

最終更新:2017/10/13

資料群ID(fond番号)
Reference code
fo0130
表題
Title
太陽コーパス
概要
Description
現代日本語の成立と確立の過程を,様々な観点から調査研究するため,20世紀初頭にもっともよく読まれた総合雑誌『太陽』(1895-1928 博文館刊)を資料として作成された日本語データベース。
配架位置
Location of material
中央資料庫,中央メディア保管庫
公開年月日
Date of release
2017/03/24
資料群に含まれる資料の年代
Dates of creation of the material in the unit of description
数量・形態
Extent of the unit of description
保存箱14箱,FD331枚,CD52枚,MO28枚
資料作成者
Name of creator
国語辞典編集室,研究開発部門第一領域(木村睦子,加藤安彦,藤原浩史,田中牧郎,山口昌也,吉田谷幸宏)
資料作成組織の履歴
Administrative / Bibliographical history
現代日本語の書き言葉の確立期は19世紀末-20世紀初,つまり文語文から口語文へ移り変わる時期に相当すると見ることができる。そういった時期に,もっとも,よく読まれていた博文館から刊行された月刊の総合雑誌『太陽』(1895-1928)は,この時代を扱うコーパスの対象として,適切な資料と考えられる。(詳細は関連資料参照)
太陽コーパスで対象にした年次と規模は次の通りである。
対象年:1895(明治28)年,1901(明治34)年,1909(明治42)年,1917(大正6)年,1925(大正14年)
総文字数:約1450万字
記事数:約3400本
著者数:約1000人
【研究経過】
1988(昭和63)年度-1998(平成10年)度
「国語辞典編集のための用例採集」<国語辞典編集室>
・国語辞典編集のため月刊の総合雑誌『太陽』からの用例抽出作業を開始した。インデックスファイルを作成するが,それは原文を当たらないと文脈が分からないという所在索引に近いものであった。
1999(平成11)年度-2000(平成12)年度
「国語辞典編集室コーパスの作成」<国語辞典編集室>
・新たに文脈を付加し,用例として拾われなかった部分をも検索できるようにするため,『太陽』コーパス作成を計画した。(用例採集事業からコーパス構築事業への移行)
(注)此の間には文部省科学研究費(創成的基礎研究費)「国際社会における日本語についての総合的研究」(略称:新プロ「日本語」)研究代表者 水谷修 課題番号:08NP0701/課題番号:09NP0701 を同時に行っている。
2001(平成13)年度-2005(平成17)年度
「現代日本語における書き言葉の実態解明と雑誌コーパスの構築」<研究開発部門第一領域>
・雑誌『太陽』を構造テキスト化して,言語研究に有用な様々な情報を埋め込み,現代語確立期の日本語を様々な観点から調査研究できるデータベースとして『太陽コーパス』を作成した。また,それを活用していくつかの研究成果を出した(関連出版物を参照)
(注)2002(平成14)年度-2005(平成17)年度科学研究費補助金基盤研究(B)課題番号:14310197 研究代表者 田中牧郎 をも行った。
なお、『太陽コーパス』を利用するにあたって開発されたソフトウェア,全文検索システム『ひまわり』と構造テキストを直接利用するアプリケーション『プリズム』,『タンポポ』がある(詳細は関連資料を参照)
資料作成年月日
Dates of accumulation of the material in the unit of description
1988-2005
管理歴
Custodial history
研究開発部門言語問題グループ(田中牧郎)より2006年8月22日に移管された
入手情報
Immediate source of acquistion
資料内容
Scope and content / Abstract
箱(1)
1『太陽コーパスの作成と活用』、『太陽コーパスの漢字処理』、『20世紀初期総合雑誌コーパスの構築による確立期現代語の高精度な記述』(以上科研費報告書) 各2冊
2「太陽コーパス」仕様書(評価版)
3「平成13年度 国立国語研究所公開研究発表会 H.13 12月20日 国立国語研究所講堂」レジュメ
4太陽コーパス本文ファイル作成マニュアル 2000年度版Ver.2.1 
5「国語辞典編集のための用例データベース」(『日本語科学5』1994年4月)の抜刷り
6「総合雑誌『太陽』の本文の様態と電子化テキスト」(『日本語科学8』2000年10月)の抜刷り 
7スカウト式インデックス情報付与マニュアル 2000年度版 Ver.1.0  2007
8太陽コーパスVer.0.3 README 2007年7月 
9『太陽』漢字処理の手引き1999年度版 Ver.1 1999年6月 
10『太陽』テキスト 漢字処理の手引き 国語辞典編集室 1999年4月 
11「雑誌『太陽』による確立期現代語の研究-『太陽コーパス』研究論文集-
*12国立国語研究所研究報告122のゲラ(封筒入り:(「太陽コーパス」のCD-ROMも1枚同封)
13「雑誌『太陽』による確立期現代語の研究-『太陽コーパス』研究論文集-」国立国語研究所研究報告122のゲラ(封筒入り) 
箱(2)作業マニュアル各種
1{「『太陽』コーパスの漢字処理-『太陽』1901の漢字調査-」 文部省科学研究費(創成的基礎研究費)「国際社会における日本語についての総合的研究」(略称:新プロ「日本語」) 研究代表者 水谷修 課題番号:09NP0701 } 作業用
2ファイル<熟字訓>太陽コーパス
3ファイル<雑誌『太陽』XMLコーパス 総合雑誌に関する研究>
4ファイル 論文の抜刷りコピー類(寄贈・その他)
5吉川さん作業ファイル
6「日本研究」第13集、15集・17集、19集のコピー 
7誤用と間違いやすい語の一覧
8誤用と間違いやすい語形
9『太陽』コーパス最終校正作業各位2003.2.26 近藤明日子
10女性雑誌校正マニュアルVer.1 2003.8.1作成2004.4.14更新
11外字一覧(『漢字処理』p58-86正誤表あり)
12包摂基準対応表 補足(『漢字処理』p8-19)
13JISX0208『JIS漢字字典』p230-245(8-23)  正誤p220、221
14漢字不揃
15「太陽コーパス」「20世紀初期総合コーパス」引用情報付与マニュアルVer.2.1(2003.8.11)の題名ファイルのみ。
16「太陽コーパス」引用情報均質化マニュアルVer.2.1(2003.8.20作成2003.12.24更新)の題名のファイルのみ。
17注タグ付与単位(2003.10.31)
18G仮名遣作業マニュアル(2003.10.31)
19熟字訓認定基準(2002.4.15)
20踊字均質化マニュアル(2002.12.25)
21踊字タグ均質化マニュアル(2004.6.4)
22踊字に関するタグの注意点(2004.7.2)
*23『太陽』1895-1928全記事(図書分類付)2001.3.29 山田・横田  分類番号順 (ファイルの表紙裏にフロッピーが添付)
24雑誌コーパス引用情報付与
25マニュアル追加項目
26覚え書き
27JISコード包摂と外字の処理について
28登録されている変換
29包摂基準 対応表および参照先
30文字鏡番号
31包摂規準対応表
32「太陽」評価版 誤字 誤正全
33均質化進行表Xls
34「太陽コーパス」引用情報付与マニュアルVer.1.0(未完)2002.4.10  田中牧郎
35「太陽コーパス」引用情報均質化マニュアルVer.2.1 2003.8.2作成 2003.12.24.更新 田中牧郎
36登録単語 2004/04/07
37伝達04年度 維新資料人名解説データについて他
38女性雑誌・文字鏡番号エラー 平成16年6月25日 小木曽
39近代語研究資料と研究「雑誌『太陽』」田中牧郎(『日本語学』9月 臨時増刊号近代日本語研究2004 Vol.23)抜刷りコピー
40女性雑誌校正マニュアルVer.1.1 2003.8.1作成2004.4.14更新 田中牧郎
41漢字表記ママ注2004-10
42漢字表記ママ注2004-10xls
43第10回 太陽研究会H.15.01.09 「『太陽』コーパスにおける程度副詞-程度大の語について-」中尾比早子
44第10回 太陽研究会2003.1.9「「太陽コーパス」を用いた類義語研究-「敏 感」を意味する形容動詞・形容詞-」田中牧郎
45「『太陽』漢字処理の手引き 1999年度版 Ver.1 1999.6国立国語研究所 国語辞典編集室」
46「日本工業規格 7ビット及び8ビットの2バイト情報交換用符号化漢字集合 JIS X028:1997」のコピープリント1部分
47「時間的変化による語の生起確率と使用分野分布への影響」山口昌也2003-01-09のパワーポイントのプリントアウトしたもの
48踊字均質化マニュアル2002年12月25日 近藤明日子
49合字の類「古筆拾影」コピープリント1部分
50草書&草体&草仮名.txt (1)-(90)
51『例解 誤字辞典〔シリーズ日本人の手習い〕』土屋道雄 2001年7月25日のコピー  作業用
52「太陽」コーパス熟字よみルビ(異なり・かな順)
53仮名遣い注リスト(異なり)
54その他(クリアーファイル)
箱(3)作業マニュアル各種
1<太陽総目次 太陽1928>と書かれたメモが貼付されたプリント
2<寺田さん 含「 『 」 』の処理>と書かれた封筒入りプリント資料
3<いったんひきあげ分‘04 1/30>と書かれた封筒入り「外字一覧」のプリント資料
4太陽研 事務書類(太陽研究会 開催承諾書 他)赤いファイル綴
5<物請>と書かれた封筒入り書類(物品請求書、寄付申込及び受入命令書 他)
6<太陽コーパス‘04 3/30 打ち合わせ会資料>と書かれた封筒入りプリント類
7「太陽コーパス」代用字のチェック 2004.7.14 田中牧郎
8「太陽コーパス」(内部資料)利用の内規 
9「密輸入物語」横浜税関監視 渡辺悌司のコピープリント
10「長編小説 蛇人」三上於菟吉のコピープリント
11その他(クリヤーファイル入り)
箱(4)著作権調査、著作権処理文書類
1<女性雑誌“著者”>と書かれた封筒入りの表のプリント(著者_z|頻度|扱い|別名|備考)
2<著作権新規判明分(web)>と書かれた封筒入りコピー資料
3<太陽 著者情報資料2004.9>と書かれた封筒入り資料
4<太陽編輯部>と書かれた封筒入りコピー資料
5「学士会の照会」「日本の詩歌をさがす」『知っていると便利シリーズ』等のコピー類(緑の紙ファイル入り)
*6太陽著作権情報の資料類ピンクのファイルケース入り MOが同封
7「朝日新聞戦前紙面データベース昭和元年-9年編(1926/12-1934/12)ユーザーズマニュアル windows対応」 発行:朝日新聞社 のプリントアウト
8女学雑誌(二)執筆者索引(正)
9『日本陸軍将官辞典』のコピー(部分)
10『陸海軍将官人事総覧』のコピー(部分)
11『海外渡航者データベース』のコピー
12『海を越えた日本人名事典』富田仁(編)(Biographical Dictionary of Japanese Travelers to the Occident 1551-1897 Edited by Hitoshi Tomita)のコピー(序の部分)
13『アンリツ100年の歩み』アンリツ株式会社社史編纂委員会(編集)平成13年6月発行のコピー部分
14『コピライト №511 Volume43』2003.11.20のコピー部分
15「明治の読売新聞取扱説明書データベース・システムCD-ROM」、「大正の読売新聞取扱説明書データベース・システムCD-ROM」、「昭和の読売新聞取扱説明書 戦前Ⅰ データベース・システムCD-ROM」「昭和の読売新聞取扱説明書 戦前Ⅱ データベース・システムCD-ROM」のプリントアウト
16著作権関係:人物記事の見出し
17「片々」のプリントコピー
18「明治期雑誌の印刷表現」(森啓 著 『明星大学研究紀要』)のコピー
19『女子美術大学研究紀要』2003年 第33号の森啓氏の原稿記事部分のコピー
20明治・大正・昭和期の「読売新聞」、昭和期の「朝日新聞」のコピー(人名採録用、マーカーで印)
21『東京紳士録』S33年度版(S32.11.30)東京探偵社 (奥付コピー)
22『公卿人名大辞典』野島寿三郎(編)1994年7月25日発行(部分コピー)
23<名簿?> 帝国秘密探偵社編集部(部分コピー)
24『日本博士録』資料提供文部省大学課 能勢岩吉(編集兼発行)昭和31年5月15日発行(部分コピー)
25『帝国大学出身人名辞典』(全4巻中、第1巻の凡例の部分コピー)
26<「太陽コ-パス」著作権処理打合せ2004年9月7日(田中)>のプリント
27<補償金額の算定基礎となる事項>のプリント
28<「太陽コーパス」CD-ROM・「太陽コーパス」研究報告書の刊行について 2004年9月7日(田中)>のプリント
29田貝氏に対する作業指示のプリント
30『近代日本政治史必携』遠山茂樹、安達淑子 岩波書店 1961年7月(全ページコピー)
31その他(クリアーファイル)
箱(5)雑誌『太陽』本文コピー
1 1895(明治28)年分
2 1901(明治34)年分
箱(6)雑誌『太陽』本文コピー
1 1909(明治42)年分
2 1917(大正6)年分
箱(7)雑誌『太陽』本文コピー
1 1925(大正14)年分
2 1928(昭和3)年分
箱(8)雑誌『太陽』本文コピー
1広告等(スカウト赤丸付き)
<メディア類>
(1)「太陽コーパス」作成途上の各種データ(FD,MO)
(2)『太陽コーパス-雑誌「太陽」日本語データベース-』(国立国語研究所資料集15)(CD-ROM)
(3)『雑誌「太陽」による確立期現代語の研究-『太陽コーパス』研究論文集-』(国立国語研究所報告122)
(4)太陽コーパス試験公開版、太陽コーパス評価版塔各種CD-ROM
評価・廃棄
Appraisal, destruction and scheduling information
追加受入
Accruals
利用条件
Access conditions
個人情報は原則として非公開。
劣化の進んだ紙資料の取り扱いに注意。
複写条件
Copyright / Conditions governing reproduction
個人情報は複写不可。
劣化の進んだ紙資料の取り扱いに注意。
資料使用言語
Language of material
日本語
物理的特徴
Physical charactristics
検索手段
Finding aids
オリジナル資料の存在
Location of originals
 複製の存在
Existence of copies
関連調査・研究
Associated material
fo0132「近代女性雑誌コーパス」
fo0133「中公・文春コーパス」
成果刊行物(DB等含む)
Publication note
『雑誌「太陽」による確立期現代語の研究-『太陽コーパス』研究論文集-』(国立国語研究所報告122,博文館新社刊,2005)
『太陽コーパス-雑誌「太陽」日本語データベース-』付CD-ROM及び『太陽コーパス』解説書(国立国語研究所資料集15,2005)
『太陽コーパスの作成と活用』(科研費報告書,1997)
『太陽コーパスの漢字処理』(科研費報告書,1999)
『20世紀初期総合雑誌コーパスの構築による確立期現代語の高精度な記述』(科研費報告書,2006)
『日本語科学5』(1994.4)
『日本語科学8』(2000.10)
備考
Note
移管年月日
Reference code
2006/8/22,2016/3/29
移管者名
Name of applicant
田中牧郎,田中牧郎
記述作成年月日
Date of record
2009/8/
記述作成者
Name of recorder
中山典子
記述言語
Language of record
日本語