語彙と文章の計量的日本語研究

ひつじ研究叢書(言語編) 第215巻
語彙と文章の計量的日本語研究

鯨井綾希 著

単行本: 368ページ
ひつじ書房
言語: 日本語
ISBN-10 ‏ : ‎ 4823413008
ISBN-13 ‏ : ‎ 978-4823413001
発売日:2025/10/20

書籍内容

自然言語処理やデータサイエンスが興隆する中で、日本語研究もその分析手法を再考する時期に差し掛かっている。これまでの日本語学が積み上げてきた数理的・定量的な研究や、世界的なコーパス言語学の潮流を鑑みたときに、計量的な日本語研究にはどのような未来がありえるだろうか。本書は、探索的な計量分析を通して語彙と文章という二つの視点が交錯する言語学的世界を描き出し、新たな計量日本語学の創設に向けた可能性を示す。

目次

はじめに

序章 計量的日本語研究の発展に向けて

  1. コーパス、データ、日本語学
  2. データサイエンスの学際性と日本語学
  3. 言語学・日本語学における計量研究の役割とその限界
  4. 計量分析に基づく日本語研究の大局的な課題
  5. 計量分析に基づく日本語研究の具体的な展望
  6. 「計量(言語|日本語)学」と「計量的日本語研究」
  7. 本書の構成と留意事項
    7.1 本書の構成
    7.2 留意事項

I 文章中における同一語句の繰り返しの量的様相

第1章 同一語句の繰り返しという研究視座

  1. 語彙と文章を結ぶ同一語句の繰り返し
  2. 電子データとコンピュータならびに計量
  3. 第Ⅰ部の研究課題
  4. 同一語句の繰り返しはどのように捉えられてきたか
    4.1 定性的研究の初期の動向
    4.2 定量的研究の初期の動向
    4.3 2000年以降の研究動向
    4.4 談話機能と関連づいた諸表現の繰り返し
    4.5 文法と関連づいた同一語句の繰り返し
    4.6 繰り返しを取り上げた研究の現状と課題
  5. まとめ
  6. 第Ⅰ部の展開

第2章 同一語句の繰り返し量の多寡と文体変化

  1. ねらい
  2. 分析上の手続き
    2.1 量的様相を見るためのTTRの利用法
    2.2 語の選定範囲
    2.3 BCCWJ(モニター版)の書籍データの絞り込み
  3. 一定の長さに見られる繰り返しの量的範囲
  4. 繰り返し量の多寡と具体的な文章
    4.1 上限・下限が異常値かどうかの確認
     4.1.1 繰り返し語が極端に少ない文章(TTRの値が0.95以上)の実例
     4.1.2 繰り返し語が極端に多い文章(TTRの値が0.45未満)の実例
    4.2 繰り返し語の多寡が見せる文体的特徴
  5. まとめ

第3章 表現媒体の違いと同一語句の繰り返し

  1. ねらい
  2. 調査上の対象・資料・視座
    2.1 同一語句の繰り返しの事例
    2.2 話し言葉と書き言葉のコーパス
    2.3 計量上の視座
  3. 書き言葉と話し言葉に見られる量的傾向の差異
    3.1 平均使用率
    3.2 50語ごとの使用率のばらつき
    3.3 1語あたりの平均繰り返し頻度
    3.4 1語あたりの平均繰り返し間隔
  4. ジャンルごとの性質から見た調査結果の解釈
  5. まとめ

第4章 学校教科書から見た同一語句の繰り返し場面

  1. ねらい
  2. 文章に現れる低頻度語と高頻度語
  3. BCCWJに含まれる「教科書」資料の概略
  4. 具体的な文脈を計量する方法
    4.1 分析に用いる語の分割単位
    4.2 用例を抽出して計量する方法
    4.3 分析に用いる二つの観点
  5. 同一語句の繰り返しが集中する場面
    5.1 品詞構成比率の差異
    5.2 繰り返しの多い文脈に特徴的な語
     5.2.1 接続詞の頻度とその差
     5.2.2 指示語(代名詞・連体詞)の頻度とその差
  6. まとめ

第5章 接続表現による場面転換と同一語句の継続使用

  1. ねらい
  2. 用語変化の計量と接続表現の分類
  3. 調査資料と計量法
    3.1 出版サブコーパスの概略
    3.2 用語類似度の概略
  4. 用語類似度の結果と値の分布上の特徴
    4.1 接続表現の前後文脈における用語類似度の全体的傾向
    4.2 用語の類似度が高い接続表現の特徴
     4.2.1 「論理的関係」の多さとその用法上の特徴
     4.2.2 「論理的関係」以外の表現の位置づけ
    4.3 用語の類似度が低い接続表現の特徴
     4.3.1 話題を変更する文脈 「話題の展開」における《転換》と《無視》
     4.3.2 次の話題に繋げる「まとめ」の文脈 「話題の展開」における《まとめ》
     4.3.3 「話題の展開」における《補足》の文脈 「ちなみに」の特徴
  5. まとめ

第6章 接続表現による場面転換と同一語句の繰り返し量

  1. ねらい
  2. 高頻度語と文章展開を関連づける視点
  3. 繰り返し量の変化を捉えるための考え方
  4. 場面転換に伴う繰り返し量の変化
    4.1 計量結果一覧とその解説
    4.2 データの概略的傾向
    4.3 接続表現の関係・機能の分布
    4.4 例外的な分布傾向を示した接続表現の実態
     4.4.1 加算的関係の《換言》に含まれる接続表現の用法
     4.4.2 話題の展開の《無視》《補足》に含まれる接続表現の用法
     4.4.3 論理的展開の《仮定条件》に含まれる接続表現の用法
  5. まとめ

第7章 文章組織に連動する同一語句の繰り返しの使用原理

  1. ねらい
  2. ここまでで明らかになっていること
  3. 分析結果の総合的解釈
    3.1 いかなる内容展開でどのように使用されるか
    3.2 いかなる意識の下で使用されるか
  4. 第Ⅰ部の学術的位置づけ
    4.1 研究上の意義
    4.2 研究上の課題

第8章 使用原理の補論

  1. ねらい
  2. 計量語彙論とその文章研究への応用
  3. 本章の研究課題
  4. 話題遷移の計量分析に際した前提
  5. 話題遷移と関連づけたDとTTRの解釈
  6. DとTTRに基づく語彙遷移と話題遷移との関係
  7. まとめ

II 語彙と文章を結ぶ定量的なまとまり

第9章 語彙のまとまりと文章のまとまり

  1. 語彙のまとまりの捉え方
  2. 文や文章と関連づけた単位語のまとまり形成
  3. 文章のまとまりに関する直感的理解と定量化
  4. 単位語のまとまり形成と語彙論的研究
  5. 第Ⅱ部の展開

第10章 母語話者と学習者の文章に見られる語彙的差異

  1. ねらい
  2. 日本語教育におけるコーパス利用と語彙
  3. 『YNU 書き言葉コーパス』の資料的特徴と加工手続き
  4. カイ二乗値を用いた語彙調査の方法
  5. 語彙的差異の量的実態とその具体例
    5.1 語彙的差異の概略 品詞に注目して
    5.2 母語話者の語彙 助動詞と接尾辞に注目して
     5.2.1 母語話者における助動詞の詳細
     5.2.2 母語話者における接尾辞の詳細
    5.3 学習者の語彙 形容詞・副詞に注目して
     5.3.1 学習者における形容詞の詳細
     5.3.2 学習者における副詞の詳細
  6. まとめ

第11章 母語話者と学習者の文章に見られる語彙運用

  1. ねらい
  2. 語彙と文章の連結
    2.1 文章単位に基づく語彙研究
    2.2 計量語彙論と文章研究
    2.3 本章の研究課題
  3. 『YNU書き言葉コーパス』のタスクの具体例
  4. 語同士の共起関係を定量化する方法
  5. タスクごとの数値の違い
  6. 数値解釈のための用例分析
    6.1 タスクの性質に基づく考察
    6.2 タスク2における類似度の特徴とその考察
    6.3 タスク8における類似度の特徴とその考察
  7. まとめ

第12章 母語話者と学習者の文章に見られる語彙ネットワーク

  1. ねらい
  2. テキストマイニングとネットワーク分析
  3. 『YNU書き言葉コーパス』の分析方法
  4. 母語話者・学習者の語彙ネットワークの特徴
    4.1 語彙ネットワークの分析に関する概要
    4.2 資料全体における語彙ネットワーク
    4.3 語彙ネットワークの段階的拡張
  5. まとめ

第13章 内容展開に伴う語彙的結束性の形成過程

  1. ねらい
  2. 語彙的結束性と文脈理解の動的プロセス
  3. 語彙の抽出と分布図の作成
    3.1 反復語句の分類とその抽出法
    3.2 調査資料とその加工手続き
  4. 主要反復語句・部分反復語句の抽出と文章中での分布
  5. 形式段落ごとの内容展開に応じた語彙のネットワーク拡張
  6. まとめ

第14章 語彙の計量から考える文章の一まとまり性

  1. ねらい
    1.1 文章という言語単位に関わる日本語学の動向
    1.2 文章の定量的な研究と本章の目的
  2. 文章の一まとまり性を定量化するための考え方
    2.1 まとまりを作るための形式的側面
    2.2 まとまりを作るための意味的側面
  3. 定量的に捉える文章のまとまりとその言語学的応用
    3.1 語の反復・共起によって形成される内容のまとまり
    3.2 まとまりの連結と部分的遷移
    3.3 構造的トピックモデルによるまとまりの総合的遷移
    3.4 語彙的な分析を経たトピックによるまとまりの遷移と相互関係
  4. 単位語の量的構造と文章の質的構造の連関

第15章 文章中における品詞構成と表現構造との相互関係

  1. ねらい
  2. 文章の文体的特徴
  3. BCCWJコアデータと品詞
  4. 取り上げる主成分の範囲と各品詞の主成分負荷量
  5. 各主成分の主成分負荷量から見た考察
  6. 各主成分に実際の文章を関連づけるための主成分得点
  7. 実際の文章から見た各主成分の解釈
    7.1 第1主成分 品詞のバリエーションの豊富さ
    7.2 第2主成分 名詞に対する修飾的な表現の有無
    7.3 第3主成分 接続詞を多用する文章と動詞を多用する文章
  8. まとめ
  9. 補遺 文章ジャンルのまとまりと傾向

第16章 文章データを用いた語彙の分類試論

  1. ねらい
  2. 品詞という分類の捉え方
  3. 実データに基づく語彙の分類方法
  4. 利用する単語分割単位と計量の手続き
    4.1 分析資料とその概説
    4.2 分析の手続き
  5. 定量的に見た名詞の分布と分類
    5.1 後接要素の収集と整理
    5.2 後接要素に基づく名詞の分布と分類
    5.3 名詞の分布・分類モデル
  6. まとめ

終章 計量日本語学の確立に向けて

  1. 本書の位置づけ
  2. 今後の研究の可能性
  3. 計量日本語学の確立に向けて

参考文献
索引

このサイトをフォロー

質的データ分析研究会の最新情報を受け取る

月1~2回、本サイトの更新情報、質的研究や混合研究法、ツールの使い方、イベント情報などEmailで受け取ることができます。