私がこのブログに記事を投稿するのも,これで4度目です。記事を投稿し始めた頃は4度目ともなれば慣れてくるだろうと思っていましたが,さにあらず,3度目あたりから記事のネタに窮するようになりました。
記事のネタに窮すると誰もが思いつくのは1つのネタで複数の記事を書くことができる 「シリーズもの」 のようで,現に, 「ブログ ネタ シリーズ」 と検索サイトで検索すれば,たくさんのウェブサイトが見つかります。私も右へ倣えで 「シリーズもの」 を利用させてもらうことにしました。
私が選んだシリーズの内容は 「文章」 です。
私たちは仕事でも私生活でもいろいろな文章,たとえば判決や準備書面,あるいは新聞記事や小説などを目にしています。それらの文章には,それぞれの文章の性質からくる特徴や筆者の癖などがあるはずです。そういった特徴や筆癖を調べてみれば,隠れた文章の趣旨や筆者の意図がわかるのではないでしょうか。そう考えて,私たちが目にする文章を調べてみることにしました。
調べ方は,Microsoft Word VBA の機能を利用して文章を単語 (※) に分解し,その単語の個数を数えるという方法です。ゆくゆくは形態素解析について勉強し,形態素解析ツールも使って調べたいとも思っていますが,まずはできるところから始めてみようと思います。
今回は,私がふだん目にする文章の中から判決を調べてみました。調べた判決は 大阪地判平成27年11月30日 です。この判決は,大阪地裁の判決で,また新聞報道もされていたことから,今回題材に選びました。
判決の事案は,先天的な難病のために発育が遅れていた子が低栄養により死亡してしまったところ,子が死亡したのは,実母が,子には十分な栄養を与えられていない状態であることを知っていたのに,十分な栄養を与えず,適切な医療も受けさせなかったからだとして,実母が保護責任者遺棄の罪で起訴されたというものです。判決で,実母は,子が十分な栄養を与えられてない状態であることを認識していなかったとして無罪となりました。
この判決を単語に分解し,単語のうち名詞だけを取り出して数の多いものから並べた結果は以下のとおりです。
1 被害者:91個
2 被告人:50個
3 者 :37個
4 栄養 :34個
5 状態 :33個
6 体重 :26個
7 食事 :24個
8 認識 :22個
9 事実 :19個
10 本件 :17個
この結果をみると
①
「被害者」(子)の個数が「被告人」(実母)の個数よりも倍近く多いことから,子に関する事実の方が実母に関する事実よりも重要であること
②
なかでも重要な事実は,「栄養」・「状態」・「体重」・「食事」・「認識」であること
が推測されます。
上記①・②は事実認定の知識がある人,たとえば弁護士ならば,判決を読めば分かることかも知れません。しかし,こうして文章を単語に分解し個数を数える方法で調べてみると,事実認定の知識がない人でも上記①・②を判決から読み取ることができます。
さらには,このようにして調べた結果を事実認定の知識がない人に対する教育やプレゼンテーション (司法修習・裁判員裁判) などで利用することもできるかもしれません。
こういう具合でこれからも色々な文章を調べていこうと思います。
正直に申し上げると,この「文章」のシリーズは,落としどころも決めないまま見切り発車で始めてしまいましたし,そもそも,始めるに当たって私に十分な知識や技術があるのかも疑問がないではありません。それでも,読者の皆様 (ここまで読んで下さった方がどれだけいらっしゃるかは心もとない限りですが) からのご指導ご鞭撻も仰ぎながら,ぼちぼちやっていきたいと思います。
これからも宜しくお願い致します。
(※)
私の能力では,文章をすべて単語だけに分解することはできませんでした。英語の文章を前提とするVBAでは日本語の文章を単語だけに分解することができない (どうしても句が混じってしまう) のかもしれません。