Tekstforståelse og Kunstig Intelligens
Læsenoter til
Prebensen : "Interpretation in Dynamic Text Understanding"
Henrik Prebensen (1939- ): Cand.mag. i fransk og historie, lektor ved Romansk Institut, Københavns Universitet. Forskning i fransk sprog og historie, og datamatisk lingvistik. Medforfatter (sammen med Carl Vikner og Bente Maegaard) til Matematik og lingvistik (1975). Var 1985-91 leder af Humanistisk EDB-Center, som 1989 blev omdannet til Institut for Humanistisk Informatik; ansvarlig for oprettelse af faget Humanistisk Informatik og medansvarlig for oprettelse af kandidatuddannelse i datalingvistik Har medvirket i undervisning og præsentation af programmer inden for naturligt sprog hos Prolog Development Center. Programmer: bl.a. BLOCKHEAD (kan downloades fra Henrik Prebensens hjemmeside), en Prolog-implementering i stil med Winograds SHRDLU.
Artiklen er fra 1990. Sidehenvisningerne følger her optrykket i kompendiet Tekstforståelse og kunstig intelligens, 2. udgave, red. Stig W. Jørgensen, Institut for Datalingvistik, HHK 1999. Læsenoterne koncentrerer sig om de første tre, mere tekniske afsnit.
s. 129: CODEXUS. Projektet kørte på Institut for Humanistisk Informatik, Københavns Universitet, frem til 1994, hvor det stoppede pga. deltagernes flytning til andre institutioner. En liste over publikationer fra Institut for Humanistik Informatik, inkl. adskillige om CODEXUS-projektet, kan findes her.
Generative Semantics. Udbrydergruppe fra Chomskys generative grammatik i 1960'erne. Generative Semantics hævdede at den semantiske repræsentation udgør dybdestrukturen (i stedet for at være en fortolkning af denne). Fremtrædende navne i Generative Semantics-bevægelsen var George Lakoff og nyligt afdøde James D. McCawley.
Montague Grammar. Richard Montague (1930-1971), amerikansk filosof der arbejdede på at bevise at formelle sprog og natursprog kan gives en semantisk fortolkning efter samme principper. Montague-grammatik: Semantiske formalismer inspireret af eller baseret på Montagues arbejde. Montague-grammatik er strengt formalistisk: Natursprogssætninger oversættes rent mekanisk til entydige logiske formler der evalueres i en model. Betydningen anskues som sandhedsværdier i mulige verdener. En vigtig forudsætning for Montague-grammatik er kompositionalitetsprincippet (se nedenfor). I Montague-grammatik har hvert syntaktisk element (S, NP, N, VP, etc) sin egen semantiske fortolkning. Et vigtigt instrument til at frembringe den kompositionelle betydning er lambda-abstraktion. Montagues egen formalisme kan håndtere kvantorer, konjunktion, infinitiver, relativsætninger, og -- meget væsentligt -- oblikke kontekster, f.eks. sætninger der indeholder ord som 'håber' og 'tror'.
homomorphic mapping. Homomorf afbildning. En homorf afbildning, homomorfi, er strukturbevarende (hvorimod en isomorf afbildning, isomorfi, er både strukturbevarende og individualitetsbevarende). Hvis man i definitionsmængden ved hjælp af en operation kan danne et nyt element, så kan man i værdimængden ved en tilsvarende operation anvendt på elementernes billeder danne billedet af det ny element i definitionsmængden. En formel definition kan findes i Matematik og lingvistik s.115ff. (Se i øvrigt også noter til Rapaport om isomorfi.)
Spørgsmål: Hvilken opfattelse af lingvistikken kommer til udtryk i Prebensens afgrænsning af de enkelte discipliners rolle i natursprogsforståelse?
s. 130: The term semantics has a very precise usage among logicians... Logikeren Alfred Tarski introducede i en artikel fra1936 betegnelsen "videnskabelig semantik". Ved logisk semantik forstår man i dag et af de områder hvor Tarski var pioner, nemlig behandlingen af et (formelt) sprog i et formelt metasprog. Den kendteste form for logisk semantik er model-teori.
the principle of compositionality. Kompositionalitetsprincippet bliver ofte tillagt Gottlob Frege (1848-1925), som dog ikke selv har brugt betegnelsen eller givet en definition som her.
Lukasiewicz's three-valued system benyttede, udover 'sand' og 'falsk', værdien 'hverken sand eller falsk', som f.eks. blev tilskrevet udsagn om fremtiden. Det var også Lukasiewicz der opfandt den såkaldte polske notation, hvormed udsagnslogik skrives uden parenteser. p & q skrives f.eks. Kpq
non-deterministic, i.e. not a homomorphism, and not even a function. Non-deterministisk, fordi der skal træffes et valg mellem den ene og den anden fortolkning, og dermed ikke en funktion, fordi en funktion altid kun giver én værdi som output.
each syntactic operation is paired with a semantic rule. Dette 'rule-to-rule' princip er en af hjørnestenene i Montague-grammatik, idet det giver muligheden for at kombinere de semantiske fortolkninger svarende til de syntakiske kategorier, som nævnt ovenfor.
s. 131: domain: da. definitionsmængden. range: da. værdimængden.
structure deletion. Fordi mere end en struktur betyder at vi, som det også siges, ikke længere har adgang til derivationen. Hvis et udtryk (en streng) u er strukturelt flertydig, kan u tilskrives mere end én struktur. Et disambigueret udtryk er altså i virkeligheden et par (u,S1) af en streng, u, og en bestemt struktur, S1, der adskiller parret fra andre par (u,S2),(u,S3),…(u,Sn) dvs med den samme streng u som førsteelement. Hvis derfor R skal føre fra en mængde A af disambiguerede strenge til en mængde A1 af flertydige strenge skal R slette en eller flere strukturer, fx S1, S3, ….
s. 132: procedural feasibility. Det er en standard-kritik af Montague-grammatik, på flere niveauer, at den kræver en ganske urealistisk mængde beregning. For at fortolke et simpelt NP som "den blå hus" skal man f.eks. operere med alle blå ting og alle huse i verden.
s. 133: latifundium. En stor landejendom (i Romerriget). Sociologer bruger ordet om "the large, corporation-owned land and factory sugar combine" i Latinamerikas historie.
ephemeral. "Flygtige".
s. 135: garden-pathlike situation. Henrik Prebensen har konstrueret flere "garden-path sætninger" på dansk:
Jeg hørte en hane gale havde sluppet løs i haven.
Jeg så en kvinde drukne med bajere i hænderne, skrålende en drikkevise, fulgte ned på perronen.
Tilbage til kursets hjemmeside.