ugnagブログ

たいした内容はありません。思いつきで書いているだけ。
開発日記がメインかな。

<< パースの方法(案) | main | ご意見募集 >>

パースの方法(案)2

頑張ってパターンを洗い出した。
こんな感じだと思う。


1-1
<コード1>
ほげほげ
ほげほげ
ほげほげ
<コード2>
2-12-22-32-4
<コード1>

ほげほげ
ほげほげ
ほげほげ
<コード2>
<コード1>
ほげほげ

ほげほげ
ほげほげ
<コード2>
<コード1>
ほげほげ
ほげほげ

ほげほげ
<コード2>
<コード1>
ほげほげ
ほげほげ
ほげほげ

<コード2>
3-13-23-33-43-53-6
<コード1>

ほげほげ

ほげほげ
ほげほげ
<コード2>
<コード1>

ほげほげ
ほげほげ

ほげほげ
<コード2>
<コード1>

ほげほげ
ほげほげ
ほげほげ

<コード2>
<コード1>
ほげほげ

ほげほげ

ほげほげ
<コード2>
<コード1>
ほげほげ

ほげほげ
ほげほげ

<コード2>
<コード1>
ほげほげ
ほげほげ

ほげほげ

<コード2>
4-14-1
<コード1>

ほげほげ

ほげほげ

ほげほげ
<コード2>
<コード1>
ほげほげ

ほげほげ

ほげほげ

<コード2>
5-1
<コード1>

ほげほげ

ほげほげ

ほげほげ

<コード2>
茶色のほげほげはコメント。 緑色のほげほげはフォルダー。 残りは全て判断不能。 ちょっと多いかな。 しかし、改めていろいろなサイトの記述を見てみると傾向として、 ・コメントはコードの直後に書くことが多く、空白行をいれない ・フォルダー名とコード名の間には空白行をいれないことが多い となっているため、ほとんどは正しく解釈できそうな気がする。 また実際問題として、読む側としては上の2-1、3-1、3-3のような 書き方をされるとわかりにくい。 従って、このときは全てコメントであろうと推測できる。 もう少し、分析する必要がありそうだ。 2007/02/22 もう少し調べていくと、 1人目 能力 HP最大 00000000 00000000 MP最大 00000000 00000000 アイテム 武器 00000000 00000000 よろい 00000000 00000000 などのように、フォルダー名がネストしているケースも あるようだ。 このことと、先の「傾向」を考えると、 2-1、2-2、3-1はそのパターンとすることが出来そうだ。 ただし、微妙なためレベル2としておきたい。 最初の解釈(青色の背景)はレベル1だ。 レベル2は背景を黄色にしてみた。 2007/02/23 01:18 その他のものは背景をピンクにした。 これをレベル3とする。 レベル3ははっきりいってお手上げだ。 だが、レベル1、レベル2に関しては、フォルダー名と思われる箇所を 文法的なチェックをすれば、少しは認識率が上がる気がする。 例えば、「主人公」、「x人目」のようなものだ。 それと、句読点の有無も判断材料になるだろう。 このチェックを通ったものはレベル1-Aとし、 通らなかったものはレベル1-Bとする。 レベル2に関しても同じように行う。 すると、 レベル1-A レベル1-B レベル2-A レベル2-B レベル3 という5段階になる。 解析が終わったときに、この解析レベルを一緒に表示すれば 修正の手作業をする際のヒントになるだろう。 それとパターン1-1で文法チェックを通った場合は、 解析レベルを上げた方がいいかもしれない。 (さっきの「例」のようなケースがあるため) だいたいの方針はこんなものかな。
プログラム・開発(ParCodeEditor) | comments (0) | -

Comments

Comment Form

本文に書いて下さい
本文にh抜きで書いて下さい