WP7
Tartalomjegyzék |
Találkozó 2011. 02. 14-ei héten
Találkozó 2011. 02. 14-ei héten
Munkaterv 2011-re
Feltettem munkaterv első változatát. A februári munkamegbeszélésen (ALL-ITCs) ezt kell véglegesítenünk. Alább a a tevékenységek közti kapcsolati háló. Az ábrán a szaggatott nyilak olyan függést jelentenek, amely részleges, vagy nagyon átlapolható. A színezés arra utal, hogy melyik fél felelős a tevékenységért: narancssárga: ITCs, zöld: ALL.
A tervből a felhasználói felület hiányzik, mert az nem okoz problémát.
figyelem! ez a változat csak tájékoztató jellegű. lejjebb fokozatosan pontosabb fog megjelenni
A 0. prototípus
Munkaterv
A márc. 23.-24.-ei szegedi megbeszélés alapján a következő munkaterv állapíttatik meg.
Keresőkifejezés jelentésreprezentációjának generálása
A specifikáció szerint elkészítendő a kereső kifejezés szerkesztője, ellenőrző modulok, elemző és megjelenítése. Az egyes elemeket a következő ábra mutatja.
A 2. és a 4. pont a május 17.-ei megbeszélés alapján lényegében késznek nyilvánítjuk, pirossal a további teendők.
A munkát vezeti: Hussami Péter (ALL)
Az egyes feladatok:
1. Szerkesztés segítése, ellenőrzések
határidő: május 15.
felelős: Minkó Mihály (KTT)
részfeladatok:
- felhasználói vélemények feldolgozása
NINCS KÉSZ
határidő: ápr. 7
- tutorial
határidő: ápr. 14 (első változat: ápr. 7)
NINCS KÉSZ
- szerkesztés, elemzés nélküli ellenőrzés (1/a, 1/b az ábrán)
KÉSZ
határidő: ápr. 15
- felszíni elemzés utáni ellenőrzés (2 az ábrán)
ELHALASZTVA
határidő: máj. 15
- help
határidő: máj. 15
2. Felszíni elemzés (szintaktikai) tökéletesítése
határidő: ápr. 30
részfeladatok:
- perdurant kijelölés
egyelőre marad a kézzel annotált
- magNP-k szintaktikus elemzése
határidő: márc. 30
felelős: Nagy Ágoston (ITCs)
a márc. 24.-ei megbeszélésen pontosítottuk a feladatokat, Veronika listát készített
kész, teendő: hibaelemzés, majd az eredménynek megfelelően további javítás (ha kell)
- kulcsok kijelölésének javítása
határidő: ápr. 15
felelős: Vincze Veronika (ITCs) ELHALASZTVA: AUG. 15
kész, teendő: hibaelemzés, majd az eredménynek megfelelően további javítás (ha kell)
3. MagNP-k jelentésreprezentációja
határidő: máj. 30
részfeladatok:
- algoritmus
határidő: ápr. 30 KÉSZ
felelős: Simonyi András (ALL)
- megvalósítás
határidő: máj. 30 KÉSZ, TESZTELÉS ALATT
felelős: Hussami Péter (ALL)
4. Parser tökéletesítése
határidő: ápr. 30
felelős: Kiss Márton
részfeladatok:
a márciusi megbeszélésen rögzítettek
- komplemens megállapítás (mintha aktív lenne az ige)
- vonzatok jelölése minden esetben,
- alany megjelölése,
- sentential complement típusú mellékmondat,
- kötelező vonzatok ellenőrzése
határidő: ápr. 15
felelős: Nagy Ágoston (ITCs)
kész, teendő:
- hibaelemzés, majd az eredménynek megfelelően további javítás (ha kell)
- hiányzó kötelező vonzat jelzése
- igei frázisok kezelése (amelyek a kontrollált nyelvben meg vannak engedve)
határidő: ápr. 25
felelős: Vincze Veronika, Nagy Ágoston (ITCs)
kész
- kopula predikatív kezelése
határidő: ápr. 25
felelős: Vincze Veronika, Nagy Ágoston (ITCs)
tesztelés van még hátra
- negáció kezelése (amennyire a kontrollált nyelvben kell)
határidő: ápr. 25
felelős: Vincze Veronika (ITCs)
kész
- a kontrollált nyelvhez szabni (apró változtatások, interfész igények, előre nem látott következmények kezelése)
megjegyzés: a sorozatok kezelése hiányzik a kontrollált nyelvre, mivel azokat a felhasználónak jeleznie kell
teendők:
- kollokációs lista,
- said-es anafóra felfedő algoritmus teljes query-re való futtatása,
- a DTD1 szerinti xml-ben adott keresőkifejezések futtatása
- tesztelés kontrollált nyelvre
határidő: ápr. 30
felelős: Kiss Márton (ITCs)
5. Jelentésreprezentáció ELHALASZTVA
határidő: máj. 15
részfeladatok:
- algoritmus
határidő: ápr. 15
felelős: Simonyi András (ALL)
- megvalósítás
határidő: máj. 15
felelős: Hussami Péter (ALL)
6. A szemantikus lexikon demója
határidő: ápr. 30
felelős: Szőts Miklós (ALL)
részfeladatok:
később részletezve
7. A jelentésreprezentáció megjelenítése
határidő: jun. 15
felelős: Minkó Mihály (KTT)
8. Integráció
határidő: jún. 15
felelős: Hussami Péter (ALL)
9. A felhasználókkal való kapcsolat (folyamatos véleménykérés)
határidő: jun. 30
felelős: Vadász Ágnes (KTT) hivatkozás címe
Végrehajtáshoz
A jelentésreprezentáció generálásának átnézeti analízis modellje van az alábbi ábrán. A fehéren hagyott elemeket a Könyvtártudomány munkacsoportja, a kékeszöldeket az ITCs különítmény, a sárgákat az ALL készíti. Az egyes osztályok:
- 1/a, 1/b elvégzi azokat az ellenőrzéseket, amelyek elemzés nélkül elvégezhetőek. A szöveget a következő DTD1 szerinti XML-ben adja át a felszíni elemzést végző modulnak. Példák is vannak.
- A felszíni elemzés a magNP-k elemzését és a kulcsok kijelölését végzi.
- A DTD2, amelyben átadja az eredményt, lényegében megegyezik a magNP oldalon adott DTD-vel. Meg kell majd különböztetni azokat a tag-eket, amelyeket az 1/b ad, és azokat, amelyeket az elemzés. Az XML-eknek végig cipelniük kell az 1/b-ben kapott tag-eket.
teendő: DTD2 pontos specifikációja (Péter, Marci) - ELKÉSZÜLT
- magNp-k szemantikus feldolgozása során előáll a magNP-k jelentésreprezentációja. Ebben az esetben a szemantikus feldolgozás szekvenciálisan követi a szintaktikus elemzést. Ha jelentésbeli ellentmondást talál, visszajelzi a felszíni elemzésnek.
teendő: a visszajelzés tag-jeinek definiálása DTD2-ben (Péter, Marci)
- Hibalista készítés. A felszíni elemzés alapján ellenőrizhető a kontrollált nyelv több szabályának teljesülése.
teendő: specifikálni (Miklós, Veronika)
- Ha a felhasználóval való párbeszéd köre zárul, azaz nem találunk több hibát, a complement meghatározás következik. Az eredményt tartalmazó XML lényegében a mostani.
- A jelentésreprezentáció generálása, és az esetleges ellentmondások visszajelzése párhuzamosan folyik a szintaktikus elemzéssel.
teendő: a DTD3 pontos specifikációja (Péter, Marci)- ELKÉSZÜLT
- A jelentésreprezentációt meg kell mutatni a felhasználónak, mert vannak ellenőrizhetetlen hibaforrások. Ehhez valószínűleg grafikus megjelenítést kell kialakítani.
A 0. prototípus a következő egyszerűsítések szerint fejleszttetik:
- a FrameNet lesz a szemantikus lexikon, az eredeti állapotban. A kísérletek alapján döntünk a továbbfejlesztés módjáról.
- elmarad a jelentésreprezentáció visszajelzése a parsernek az esetleges inkonzisztenciákról. Tehát a jelentésreprezentációt generáló algoritmusok a teljes keresőkifejezés felszini ill. teljes elemzését kapják inputként.
magNP keresés
Először a magNP-ken alapuló keresést valósítjuk meg, az ábra alapján. A fehér elemek a KKT, a kékek az ITCs. a sárgák az ALL feladatai. A jelenlegi specifikációkkal,a kész elemek jelenlegi állapotával tervezzük elkészíteni. Később a javított elemeket cseréljük.
A teljes munkát Hussami Péter vezeti.
A készenléti állapot, és a határidők:
- kereső kifejezés írása, és 1/a, 1/b: kész, a megfelelő outputot adja
- ellenőrzés (2):
- specifikáció: Vincze Veronika, aug. 20
- megvalósítás: Danics Attila, ?
- felszíni elemzések (3/a, 3/b) kész; tesztelés, hibaelemzés: szept. 20
- magNP-k szemantikus feldolgozása: kész, tesztelés, hibaelemzés: aug. 15 (Simonyi András)
- magNP-k illesztése: specifikáció kész, határidő: aug. 22. (Hussami Péter)
- integráció, supervisor, határidő: szept. 20. (Hussami Péter)
szemantikus lexikon
Kialakítását szőts Miklós koordinálja. a FrameNet-en alapul, átvesszük releváns frame-jeit (a frame-eket mint szinonimahalmazokat kezeljük), s fokozatosan kiegészítjük.
Tevékenységek, határidők:
- használható, de hiányos szemantikus lexikon szept. 30. Ennek részfeladatai:
- elvi kérdések tisztázása, felelős Szőts Miklós, határidő: aug. 31. megj.: a tisztázás során hozott döntések befolyásolhatják az alábbi feladatokat
- a FrameNet adatainak fájlrendszerbe való transzformálása, a program gyakorlatilag kész, változtatások lehetnek szept. 15.-ig, felelős Szőts Miklós
- a szintaktikai viszonyokat jelölő FrameNet jelöléskonvenció fordítása a parser jelöléseire, specifikálva a Resource-ok oldalon, implementálás szept. 20-ig
- a szemantikus lexikon szerkesztésére szolgáló felület, felelős Szőts Miklós,
- specifikálás: határidő aug. 17.
- implementálás: szept, 20.
- a parser vonzatkereteinek egyeztetése a FrameNet valence group-jaival, felelős Kiss Márton, határidő: szept. 20.
- a szemantikus lexikon bővítése. Ennek részfeladatai:
- útmutató a lexikon bővítéséhez, felelős Szőts Miklós, határidő: okt. 7
- folyamatos bővítés