Fond Document

※研究資料の閲覧利用は、事前の申し込みが必要です。詳しくは「研究資料室の利用について」をご覧ください。


最終更新:2023/07/27

資料群ID(fond番号)
Reference code
fo0208
表題
Title
代表性を有する大規模日本語書き言葉コーパスの構築(BCCWJ)
概要
Description
『現代日本語書き言葉均衡コーパス』(BCCWJ)は,現代日本語の書き言葉の全体像を把握するために構築したコーパスであり,書籍全般,雑誌全般,新聞,白書,ブログ, ネット掲示板,教科書,法律などのジャンルにまたがって1億430万語のデータを格納しており、各ジャンルについて無作為にサンプルが抽出されている。収蔵資料は,2006年から2011年にかけての,『現代日本語書き言葉均衡コーパス』作成にかかわる資料。
目録
Catalogue
配架位置
Location of material
中央資料庫,中央メディア保管庫
公開年月日
Date of release
2017/03/24
資料群に含まれる資料の年代
Dates of creation of the material in the unit of description
2006-2011
数量・形態
Extent of the unit of description
保存箱645箱,CD149枚,DVD34枚
資料作成者
Name of creator
前川喜久雄・森本祥子・小沼悦・丸山岳彦・柏野和佳子・山崎誠
資料作成組織の履歴
Administrative / Bibliographical history
研究開発部門(平成18年4月-平成21年9月)
コーパス開発センター(平成21年9月-平成23年3月)
資料作成年月日
Dates of accumulation of the material in the unit of description
2006/4-2011/3
管理歴
Custodial history
入手情報
Immediate source of acquistion
資料内容
Scope and content / Abstract
『現代日本語書き言葉均衡コーパス』,台帳,サンプル書籍,著作権者許諾書ファイル等
サンプル書籍調査データ(用紙と抽出本文)(PDF)(DVD)
サンプル新聞・書籍調査データ(用紙と抽出本文)(PDF)(CD)
評価・廃棄
Appraisal, destruction and scheduling information
追加受入
Accruals
利用条件
Access conditions
個人情報は原則として非公開。
複写条件
Copyright / Conditions governing reproduction
個人情報は複写不可。
資料使用言語
Language of material
日本語
物理的特徴
Physical charactristics
検索手段
Finding aids
オリジナル資料の存在
Location of originals
 複製の存在
Existence of copies
CD146枚・DVD34枚のバックアップデータ
関連調査・研究
Associated material
fo0271「代表性を有する大規模日本語書き言葉コーパスの構築(BCCWJ)・補遺」
fo0287「代表性を有する大規模日本語書き言葉コーパスの構築(BCCWJ)・補遺2」
成果刊行物(DB等含む)
Publication note
『現代日本語書き言葉均衡コーパス』
丸山岳彦・山崎誠・柏野和佳子・佐野大樹・秋元祐哉・稲益佐知子・田中弥生・大矢内夢子 (2011a). 『『現代日本語書き言葉均衡コーパス』におけるサンプリングの原理と運用』, 特定領域研究「日本語コーパス」平成22年度研究成果報告書 (JC-D-10-01)
丸山岳彦・山崎誠・柏野和佳子・佐野大樹・秋元祐哉・稲益佐知子・田中弥生・大矢内夢子 (2011b). 『『現代日本語書き言葉均衡コーパス』に含まれるサンプルおよび書誌情報の設計と実装』, 特定領域研究「日本語コーパス」平成22年度研究成果報告書 (JC-D-10-02)
柏野和佳子・丸山岳彦・稲益佐知子・田中弥生・秋元祐哉・佐野大樹・大矢内夢子・山崎誠 (2009). 『『現代日本語書き言葉均衡コーパス』における収録テキストの抽出手順と事例』, 特定領域研究「日本語コーパス」平成20年度研究成果報告書 (JC-D-08-01)
佐野大樹・丸山岳彦・山崎誠・柏野和佳子・秋元祐哉・稲益佐知子・田中弥生・大矢内夢子 (2009). 『語彙密度を利用した『現代日本語書き言葉均衡コーパス』テクスト分類の試み』, 特定領域研究「日本語コーパス」平成20年度研究成果報告書 (JC-D-08-02)
丸山岳彦・秋元祐哉 (2008). 『『現代日本語書き言葉均衡コーパス』におけるサンプル構成比の算出法(2) --コーパスの設計とサンプルの無作為抽出法--』, 特定領域研究「日本語コーパス」平成19年度研究成果報告書 (JC-D-07-01)
柏野和佳子・丸山岳彦・秋元祐哉・稲益佐知子・佐野大樹・田中弥生・山崎誠 (2008). 『『現代日本語書き言葉均衡コーパス』における書籍サンプルの多様性』, 特定領域研究「日本語コーパス」平成19年度研究成果報告書 (JC-D-07-02)
丸山岳彦・秋元祐哉 (2007). 『『現代日本語書き言葉均衡コーパス』におけるサンプル構成比の算出法 --現代日本語書き言葉の文字数調査--』, 特定領域研究「日本語コーパス」平成18年度研究成果報告書 (JC-D-06-02)
備考
Note
移管年月日
Date of approval
2014/8/18,2011/6/7
移管者名
Name of applicant
前川喜久雄,丸山岳彦
記述作成年月日
Date of record
2016/07/20
記述作成者
Name of recorder
山口亮
記述言語
Language of record
日本語