こんな感じだと思う。
1-1 |
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
2-1 | 2-2 | 2-3 | 2-4 |
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
3-1 | 3-2 | 3-3 | 3-4 | 3-5 | 3-6 |
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
4-1 | 4-1 |
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
5-1 |
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
|
茶色のほげほげはコメント。
緑色のほげほげはフォルダー。
残りは全て判断不能。
ちょっと多いかな。
しかし、改めていろいろなサイトの記述を見てみると傾向として、
・コメントはコードの直後に書くことが多く、空白行をいれない
・フォルダー名とコード名の間には空白行をいれないことが多い
となっているため、ほとんどは正しく解釈できそうな気がする。
また実際問題として、読む側としては上の2-1、3-1、3-3のような
書き方をされるとわかりにくい。
従って、このときは全てコメントであろうと推測できる。
もう少し、分析する必要がありそうだ。
2007/02/22
もう少し調べていくと、
1人目
能力
HP最大
00000000 00000000
MP最大
00000000 00000000
アイテム
武器
00000000 00000000
よろい
00000000 00000000
などのように、フォルダー名がネストしているケースも
あるようだ。
このことと、先の「傾向」を考えると、
2-1、2-2、3-1はそのパターンとすることが出来そうだ。
ただし、微妙なためレベル2としておきたい。
最初の解釈(青色の背景)はレベル1だ。
レベル2は背景を黄色にしてみた。
2007/02/23 01:18
その他のものは背景をピンクにした。
これをレベル3とする。
レベル3ははっきりいってお手上げだ。
だが、レベル1、レベル2に関しては、フォルダー名と思われる箇所を
文法的なチェックをすれば、少しは認識率が上がる気がする。
例えば、「主人公」、「x人目」のようなものだ。
それと、句読点の有無も判断材料になるだろう。
このチェックを通ったものはレベル1-Aとし、
通らなかったものはレベル1-Bとする。
レベル2に関しても同じように行う。
すると、
レベル1-A
レベル1-B
レベル2-A
レベル2-B
レベル3
という5段階になる。
解析が終わったときに、この解析レベルを一緒に表示すれば
修正の手作業をする際のヒントになるだろう。
それとパターン1-1で文法チェックを通った場合は、
解析レベルを上げた方がいいかもしれない。
(さっきの「例」のようなケースがあるため)
だいたいの方針はこんなものかな。
Comments