使用したソフトは・・・
データを揃えるのに使用したソフトはエクセルです。
というのもエクセルで作っておけば、ファイルメーカーやアクセスのような
データベース専用のソフトへ簡単にエクスポートできるからです。
そうして項目語彙を行にどんどん追加していきました。
列には項目語彙の読み仮名、英訳、例文などの情報を入力していきました。
「単なる語彙表ではない!」データベースの膨大さに気づく
しかしデータベースの語彙量が増えれば増えるほど、
単純に行に項目語彙を追加していけばいい、
というわけではないことが分かってきました。
それはなぜか。
限られた画面で実際に目にできる語彙量は決まっています。
ですから、
全体的にどれだけの語彙があるのか瞬時に把握できなくなってくるのです。
例えば、
「一体どれだけの規模のデータで、
その中のどの辺りの語彙について今自分は情報を追加しているのか」
「見覚えのある語彙がいくつか出てきたけど、
同じ語彙を複数採用しているのではないか」
というようにだんだん分からなくなってくるのです。
同じ語彙を複数採用していたとして、
「だったら検索機能で検索したらいいのでは?」
と思われるかもしれません。
しかし、語彙が数千にもなってくると、
項目語彙もその他の情報として入っている語彙も、
同じように検索してしまいます。
そしてそれらが、広いエクセルのシートのあちらこちらに点在しているわけです。
その他、メンバーから
- できるだけ一度にデータが見たい
- 印刷すると、枚数が膨大で大変
- この語彙と同じような意味合いの別の語彙が採用されていた。
その二つの語彙の関係性はどうやって表すのか
などの意見が出てきました。
解決策は?
そこで項目語彙数を減らすことになりました。
しかし、語彙を減らすとデータベースが充実したものにならない、
という問題があります。
私たちがとりあえずとった対策は
「項目語彙からは外すが、それが他の項目語彙に関連する場合は
付随情報として採用しよう」というものでした。
つまり、行に収まっていた項目語彙を
別の項目語彙の「関連語」という列に移動させて採用したのです。
こうすることで、行の数は減らせ、
しかも項目語彙とその語彙との関連性が分かり(関連語)、
データベースも充実させられると考えたのです。
項目語彙を減らしデータベースの規模を小さくする作業
一度採用した項目語彙を減らし、
データベースの行を少なくする作業を進めました。
ところが、
これがインターネット公開の段階で大変なことになりました。
データベースをエクセルで見ていた時には、
検索すれば、知りたい語彙が「項目語彙」か
項目語彙の「関連語」かという違いがあっても、
必ずエクセルの大きい一枚のシートの中から目的の語彙に到達できます。
しかし、インターネットで公開する場合、
エクセルで検索していたようにはいきませんでした。
検索対象になるのは「項目語彙」ですから、
検索に引っ掛かってくるのは当然「項目語彙」だけなのです。
つまり、項目語彙から外し、関連語にしてしまった語彙は
ヒットさせることができない、ということに気づきました。
データベースには収録されているものの、
「関連語」になってしまった語彙は検索対象にはならないので、
いくら検索しても「結果0件です」になってしまうのです。
結局、一度項目語彙から外した語彙を、もう一度項目語彙として
採用しなおさなければなりませんでした。
せっかくたたんだシャツを、
もう一度広げるというようなことをすることになったのです。
2007.10.18 13:31 - まえちゃん


