こちら「日本語でケアナビ」開発室

2008年3月のシンポジウムの詳細が決定!

しもやん

「使える」データベースへの挑戦

名詞50音リスト

「日本語でケアナビ」公開までには、データベースを作るための
補助的な役割を担っていたデータが、生まれては消えていきました。
大活躍だったデータもあればその逆もあり・・・
今回はそういった「縁の下の力持ち」的なデータについて
少しお話したいと思います。

現在の「日本語でケアナビ」からはあまりわかりませんが、
開発中は全てのことばがカテゴリー分けされていました。
(あ、タグ検索には少しその名残がありますね。)
主に、病院関係や介護関係など、場面による分け方をしていたんですが、
その中で1つだけ、特殊なカテゴリーに入れられていたものが「名詞」です。
ここでこの「名詞」というカテゴリーに疑問を感じた方は
「『名詞』誕生」の回をご覧ください。

開発当初、名詞には

  • ところ
  • もの
  • こと
  • ひと
  • 社会

の5つの「大分類」があり、それらの下位層には16の「小分類」があり、
そしてさらに!その下には5~10個の「詳細分類」なるものがあったのです。
例えば「もの」ならこんな感じです。

図:「もの」の下に3分類、そんそれぞれにいくつもの分類がある

ここで紹介したのは一部ですが、「詳細分類」は全部で140ぐらいありました。
ちょっと分けすぎ??という感じですが、
それだけの種類の名詞が採用されていたんです。

このように細かく分類すると、きれいに整理されるので見やすいのは確かです。
その反面、作業をするときにことばが見つけにくいという問題が!
色々な作業をしていく中で
「あ、あのことば採用してたっけ?」
「あのことばって、どの場面にあった?」
という声が上がったとき、分類別にエクセルのシートに分かれていると、
そのことばが入っていそうなシートを1枚1枚探さなくてはいけません。
それって非常に手間がかかるので、作業の効率はいいとは言えません。
当時はデータがこんな感じになっていました。

図:分類ごとに独立したシート

そうかと言って、全ての名詞データを1枚のシートに入力すると、
データ量が多すぎて検索結果が出るのも遅いし・・・
そこで、
「仕方ない。50音順にするか!」
と一念発起し、

  1. 一度全ての名詞データを1枚のシートに入力する。
  2. その後、50音順でソートをかける。
  3. 「あ行」「か行」のようにシートを分けていく。

という手順で「名詞50音リスト」を完成させました。
ご参考までに、実際のデータを載せてみました。

上のように、分類別になっていたリストを
こんな風に50音別にしました。

図:50音それぞれでシートを分類

ある作業をしているときに、何か1つのことばを見つけたくなると、
本来の作業そっちのけで
そのことばを検索しなければならなくなってしまいます。
「そんな無駄な時間使いたくない!」(っていうか時間がない!)
と思い、手間を覚悟で50音リストを作ったという訳です。

このリスト、決して表舞台に出ることはありませんでしたが、
基本データベースのチェックや、採用し忘れていることばがないかを
確認したりするときに、非常に役に立ってくれました。

今は過去のフォルダの中で(とりあえず)安らかに眠っていますが、
いつかきちんと弔ってあげようと思っています。

まえちゃん
えっ 葬るんや

2008.01.19 13:25 - しもやん

次は「ことばとの長い格闘の巻」

このトピックの記事一覧へ

コメントする