UNL2010: Difference between revisions

From UNLwiki
Jump to navigationJump to search
imported>Martins
No edit summary
imported>Martins
No edit summary
Line 1: Line 1:
These guidelines were built to normalize and standardize UNLization strategies and to guide the development of the natural language generation grammars (which would benefit from these standards as a sort of NL-to-UNL transfer grammar). They should not be taken as the UNL Specifications themselves, as long as 1) they are rather experimental and tentative; 2) they differ, in several points, from the current version of the Specifications; 3) they do not follow some of the existing UNLization policies; and 4) they have not been approved yet by the UNL Community.
How to UNLize it?


== PREMISES ==
== J'avais six ans. ==
These guidelines are derived from three main premises:
SOMEONE AVOIR (NUMBER) AN(S) <br />
Information conveyed by natural language utterances can be represented by a natural language independent hyper-graph structure.
Options to be discussed:
Texts can be treated as a set of semantic nodes interlinked by semantic relations and modified by semantic attributes. Nodes can be either simple (UWs) or complex (SCOPES, i.e., sub-graphs, such as clauses).
*AOJ(AVOIR, SOMEONE), OBJ(AVOIR, YEAR OLD), QUA(YEAR OLD, NUMBER)
The UNL representation is an interpretation rather than a translation of a given text.
*AOJ(BE, SOMEONE), OBJ(BE, YEAR OLD), QUA(YEAR OLD, NUMBER)
The main goal of the UNLization process is to represent the knowledge structure of the source text, which should be detached from its verbal structure. This means that the UNL representation should not be committed to replicate the lexical and the syntactic choices of the original, but should focus in representing, in a language-independent and non-ambiguous format, one of its possible readings, preferably the most conventional one.
The UNL representation should be as semantically complete as possible.
This means that, whenever possible, all the semantic valencies of the original text should be saturated, including anaphora, ellipses, presuppositions and implicatures. Pronouns and pro-forms, for instance, are expected to be replaced by their antecedents, and should not be represented in UNL, except in case of exophoric reference (indefinite pronouns, interrogative pronouns and personal pronouns that are not co-indexed to any existing antecedent).


== UNL EXPRESSION ==
For the time being, the network macrostructure has not been addressed, but it seems clear that the relation “nxt”, proposed by the UNL Centre to link sentences and paragraphs, is syntactic rather than semantic, and it is not appropriate for a network claimed to be mostly semantic. Some alternatives have been considered (especially Discourse Representation Theory - DRT, proposed by Hans Kamp; and Rhetorical Structure Theory - RST, proposed by William Mann and Sandra Thompson), but they are still under investigation.


The document structure is also subject to change, and it is likely to move to a XML schema, which is still under development. For the moment, the syntax defined by the UNLCenter has been kept.


== THREE-LAYERED REPRESENTATION ==
habite la France -obj or plc?
The basic assumption of the UNL approach is that the meaning conveyed by natural language sentences can be formally represented through three different types of semantic units: UWs, attributes and relations. This three-layered representation model is the cornerstone of UNL and its most distinctive feature over other semantic networks, which normally proposes only two levels: edges and vertices. Nevertheless, it poses several problems to the UNLization as the distinction between what is supposed to be represented by each unit is not always clear. In order to avoid superposition and to facilitate the enconversion process, we have tried to clearly identify the scope of each unit using the following procedures:
*RELATIONS represent syntactic relations (subject, object, complement, adjunct) with their corresponding semantic value;
*UWs represent lexemes from open classes:
**nouns, including proper nouns, abbreviations and acronyms;
**adjectives;
**full verbs;
**adverbs (adjuncts, conjuncts and disjuncts); and
**numbers (to be always represented as Arabic numerals)
*ATTRIBUTES represent bound morphemes, closed classes and context-dependent information:
**grammatical categories (gender, number, tense, aspect, mood, voice, etc)
**determiners (articles and demonstratives);
**adpositions (prepositions, postpositions and circumpositions);
**auxiliary and quasi-auxiliary verbs (auxiliaries, modals, coverbs, preverbs);
**interjections;
**conjunctions;
**adverbs (specifiers);
**text structure (.@entry, .@topic, .@qfocus, .@emphasis, .@relative, etc);
**speech acts (.@request, .@suggestion, .@offer, etc);
**other context-dependent information (such as politeness, metaphor, irony, etc);
Pronouns and pro-forms are expected to be replaced by their antecedents and not to be represented in UNL, except in case of exophoric reference (indefinite pronouns, interrogative pronouns and personal pronouns that are not coindexed to any existing antecedent).


The main changes concerning the present UNL Specifications are the following:
À Léon Werth quand il était petit garçon.


== RELATIONS ==
C’est ainsi que j’ai abandonné, à l’âge de six ans, une magnifique carrière de peintre.
The set of relations is exactly the same as defined in the UNL 2005 Specifications.


== ATTRIBUTES ==
cette grande personne habite la France où elle a faim et froid.
The set of attributes has been substantially increased to represent information concerning grammatical categories, determiners, adpositions and conjunctions. The main additions are the following:
*gender: @male, @female
*degree: @more, @less, @equal, @most, @least, @plus, @minus, etc.
*demonstrative: @proximal, @medial, @distal
*preposition: @under, @below, @above, @after, @before, etc.
*conjunction: @before, @after, etc.
*relative (for the main entry of relative clauses): @relative
The decision to represent closed classes as attributes instead of UWs has led to a different way of representing several natural language phenomena:
;this X
:UNL Centre: mod(X, this)
:These guidelines: X.@proximal
;X is under Y
:UNL Centre: plc(X, under), obj(under, Y)
:These guidelines: plc(X, Y.@under)
;bigger than Y
:UNL centre: man(big, more), bas(big, Y)
:These guidelines: bas(big.@more, Y)
etc.


Additionally, the following general principles were adopted:
Lorsque j’avais six ans j’ai vu, une fois, une magnifique image, dans un livre sur la forêt vierge qui s’appelait ''Histoires vécues''.
*interjections, filled pauses, phatic expressions and short answers should be represented by the null UW (to be represented as "00") together with the attribute indicating the corresponding speech act (.@confirmation, .@surprise, etc).
*the attribute .@entry (mandatory in every scope, including the main one) should be placed at the left (source) side of at least one relation;
*the difference between mentioning and using a word (which is a quite frequent situation in a metalinguistic text such as Cratylus) should be represented by the attribute .[[@mention]] (which is not the same as "quotation");
*attributes should be used in alphabetical order (“.@entry.@past” instead of “.@past.@entry”).


== UNIVERSAL WORDS ==
Je savais reconnaître, du premier coup d œil, la Chine de l’Arizona
The set of Universal Words, i.e., the UNL Dictionary, has undergone the most radical change, as we have been using the UNLWN30, a set of UWs automatically extracted out of the WordNet30. In this dictionary, UWs correspond to sets of synonyms (synsets) of English, and may have several different headwords. They are represented as 9-digit strings with the following format:
<POS><WORDNETID>
where <POS> = {1,2,3,4}, being 1 = noun, 2 = verb, 3 = adjective and 4 = adverb; <br />
and <WORDNETID> is the synset ID in the WN3.0.


== SCOPES ==
C’est utile
In order to enhance the possibility of knowledge extraction out of the UNL document, we have restricted the use of scopes only to cases involving semantic ambiguity, such as:
*electric [light orchestra], with scope, i.e., a "light orchestra" that is electric; or
*electric light orchestra, without scope, i.e., an orchestra that is both "light" and "electric".


== INVITATION ==


Finally, we ought to stress that the UNLization standards here presented are tentative and provisional, and they are subject to improvements and changes as soon as they were proved not to be the most adequate ones. In order to provide such enhancements, we would invite UNL Society members and other people interested in UNL to criticize them, to propose alternatives and to help us build an NL-to-UNL transfer grammar as comprehensive as possible.
n’est-ce pas


== BROWSE BY ALPHABETICAL ORDER ==
fait d’autres tentatives que celle
[[abbreviations]]    [[acronyms]]    [[voice#Active voice|active voice]]    [[adjectives]]    [[adjuncts]]    [[adverbs]]    [[apposition]]    [[articles]]    [[aspect]]    [[verbs|auxiliary verbs]]    [[capitalization]]    [[cardinals]]    [[common nouns]]    [[comparative adjectives]]    [[adverbs|comparative adverbs]]    [[comparative]]    [[complement]]    [[complex words]]    [[compound words]]    [[conditional]]    [[conjunctions]]    [[conjuncts]]    [[contractions]]    [[coordination]]    [[verbs#Copula|copula]]    [[degree]]    [[demonstratives]]    [[determiners]]    [[digits]]    [[disjuncts]]    [[equations]]    [[fractions]]    [[gender]]    [[imperative]]    [[indicative]]    [[intensifiers]]    [[interjections]]    [[interrogative]]    [[verbs|modal verbs]]    [[mood]]    [[numerals|multiplicative numerals]]    [[nominalization]]    [[numbers]]    [[numbers in names]]    [[numbers in titles]]    [[numerals]]    [[object]]    [[numerals|ordinals]]    [[voice#Passive voice|passive]]    [[person]]    [[pronouns#Personal pronouns|personal pronouns]]    [[pronouns#Possessive pronouns|possessive pronouns]]    [[premodifiers]]    [[prepositions]]    [[pronouns]]    [[proper nouns]]    [[punctuation marks]]    [[quantifiers]]    [[pronouns#Reciprocal Pronouns|reciprocal pronouns]]    [[pronouns#Reflexive pronouns|reflexive pronouns]]    [[voice#Reflexive voice|reflexive voice]]    [[relative clause]]    [[pronouns#Relative pronouns|relative pronouns]]    [[spelling]]    [[subject]]    [[subjunctive]]    [[subordination]]    [[adjectives|superlative adjectives]]    [[adverbs|superlative adverbs]]    [[superlative]]    [[tense]]    [[typographical symbols]]    [[verb modification]]    [[verb modifiers]]    [[verbs]]    [[vocative]]    [[voice]]


== BROWSE BY SUBJECT ==
C’est étrange


{{#tree:id=unlization|openlevels=0|root=Categories|
C’est étrange, dis-je au petit prince - "dis-je" - obj - "c'est etrange"?
*grammatical categories
 
**[[aspect]]
Celui-là, se dit le petit prince, tandis qu’il poursuivait plus loin son voyage, celui-là serait méprisé  - repetition
**[[degree]]
 
**[[gender]]
la guerre des moutons et des fleurs - AND?
**[[mood]]
 
**[[number]]
 
**[[person]]
c’est le seul qui ne me paraisse pas ridicule - le seul?
**[[tense]]
 
**[[voice]]
*part of speech
 
**[[abbreviations]]
Celui-là, se dit en lui-même le petit prince, il raisonne un peu comme mon ivrogne.  - "un peu" modify the relation? "Celui-la" and "il"? il.@emphasis.@distal?
**[[acronyms]]
 
**[[adjectives]]
Alors ce sera merveilleux quand tu m’auras apprivoisé!
**[[adverbs]]
Alors je tâtonne comme ci et comme ça, tant bien que mal.
**[[articles]]
 
**[[conjunctions]]
 
**[[contractions]]
n’osait pas s’avouer - @dare?
**[[demonstratives]]
 
**[[determiners]]
il regrettait cette planète bénie à cause, surtout, des mille quatre cent quarante couchers de soleil par vingt-quatre heures!  SURTOUT - @especially?
**[[intensifiers]]
 
**[[interjections]]
Ce n’est pas tout à fait ici! - tout à fait - @exactly?
**[[nouns]]
 
**[[numerals]]
 
**[[prepositions]]
Ce n’était qu’un renard semblable à cent mille autres - Ce n’était qu’un, It was nothing but... @simply ?
**[[postpositions]]
 
**[[pronouns]]
un renard semblable à cent mille autres - semblable - @like?? or UW?  cent mille autres? cent mille.@other?
**[[quantifiers]]
 
**[[verbs]]
 
*syntax
Ce qui m’émeut si fort de ce petit prince endormi,  - about this little prince? gol + @about?
**[[apposition]]
 
**[[cleft sentences]]
Ce sera gentil, tu sais. TU SAIS?
**[[complement]]
 
**[[coordination]]
ce sera ce soir vers sept heures quarante (minutes.@ellipsis?)!  relation between "ce soir" "sept heures"? between "heure" and "quarante (minutes)"?    vers? @by? @around?
**[[ellipsis]]
 
**[[object]]
 
**[[subject]]
Celui-là est déjà très malade.  @already?
**[[subordination]]
 
**[[vocative]]
je n’avais avec moi ni mécanicien, ni passagers - AVEC MOI: avais - ptn - mécanicien?
}}
 
 
Et de nouveau, sans comprendre pourquoi, j’éprouvai un chagrin bizarre. - POURQUOI? 00@wh or a UW (reason)?
 
 
Et je fus stupéfait d’entendre le petit bonhomme me répondre:  entendre ... me repondre? repondre@relative? @past?
 
 
 
car, sinon, pour m’humilier moi aussi, elle se laisserait vraiment mourir (pds). SINON? @otherwise
 
 
un arrosoir d’eau fraîche? mod?
 
 
Il me voyait, mon marteau à la main, et les doigts noirs de cambouis, penché sur un objet qui lui semblait très laid.  penché? a verb? what tense?
 
 
Il n’a jamais rien fait - double negation: fait.@not + 00.@not.@thing? or fait.@not + 00.@any.@thing?
 
 
J’ai ainsi vécu seul, sans personne avec qui parler véritablement,  a realtive object? parler.@relative - obj - personne? or parler - obj - personne.@relative?
 
une panne il y a six ans - panne - tim - ans.@ago?
 
 
Je ne suis pas si enrhumée que ça (pds) .  my cold is not that bad (English translation of Petit Prince) or "I am not that sick.." - there is no such concept as "enrhumé" in Wordnet.
 
"des centaines d’autres"  centaines??
 
L'homme de la locomotive l'ignore lui-même. (?reflexive?)
 
La leçon que je donnais en valait la peine.
 
d'année en année
 
La preuve que le petit prince a existé c'est qu'il était ravissant, qu'il riait, et qu'il voulait un mouton.
 
La première fois ç’a été, il y a vingt-deux ans, par un hanneton qui était tombé Dieu sait d’où.
La seconde fois ç’à été, il y a onze ans, par une crise de rhumatisme.
 
 
- une montagne haute '''comme celle-ci'''
 
- Elles se rassurent '''comme elles peuvent'''.
 
- Je fis remarquer au petit prince que les baobabs ne sont pas des arbustes, mais des arbres grands comme des églises et que, si même il emportait '''avec lui''' tout un troupeau d’éléphants, ce troupeau ne viendrait pas à bout d’un seul baobab.
 
- ces étoiles-là
 
- Mais, '''comme il disait''',  On ne sait jamais!
 
 
 
Petit bonhomme, n’est-ce pas que c’est un mauvais rêve cette histoire de serpent et de rendez-vous et d’étoile (pds). How to link the vocative to the rest of the phrase?
 
 
Quand il éteint son réverbère ça endort la fleur ou l’étoile.  "eteint" and "endort" have a double relation - tim and agt? temporary solution: NULL UW for "quand" which is linked tim FROM "endort" and "tim" TO "eteint".
 
Quand je réussis à le rejoindre  REUSSIR? Modal verb? @success?
 
 
tu deviens responsable - BECOME? modal verb?
 
I made him laugh - laugh@causative? who is agt? I or him?
 
Mais mon dessin, bien sûr, est beaucoup '''moins ravissant que''' le modèle.
 
'''Mais non!'''
 
il faut arracher la plante aussitôt, '''dès qu’on a su la reconnaître'''.dès que - tim ou con?
 
Mais si tu viens '''n’importe quand'''
 
'''Quand''' un astronome découvre l’une d’elles, il lui donne pour nom un numéro - quand (once) - tim or adv?
 
'''Quant aux''' grosses bêtes, je ne crains rien. quand aux (concernant)- about grosses bêtes?
 
'''Quel''' âge a-t-il? âge - ans? quel - qua ou mod?
 
'''Quelle''' drôle d’idée! @surprised?
 
voilà un explorateur! VOILA?
Voici mon secret.  VOICI?
 
je crois qu’elle m’a apprivoisé  - apprivoiser@opinion. where is "je"?

Revision as of 13:16, 14 July 2010

How to UNLize it?

J'avais six ans.

SOMEONE AVOIR (NUMBER) AN(S)
Options to be discussed:

  • AOJ(AVOIR, SOMEONE), OBJ(AVOIR, YEAR OLD), QUA(YEAR OLD, NUMBER)
  • AOJ(BE, SOMEONE), OBJ(BE, YEAR OLD), QUA(YEAR OLD, NUMBER)


habite la France -obj or plc?

À Léon Werth quand il était petit garçon.

C’est ainsi que j’ai abandonné, à l’âge de six ans, une magnifique carrière de peintre.

cette grande personne habite la France où elle a faim et froid.

Lorsque j’avais six ans j’ai vu, une fois, une magnifique image, dans un livre sur la forêt vierge qui s’appelait Histoires vécues.

Je savais reconnaître, du premier coup d œil, la Chine de l’Arizona

C’est utile


n’est-ce pas

fait d’autres tentatives que celle

C’est étrange

C’est étrange, dis-je au petit prince - "dis-je" - obj - "c'est etrange"?

Celui-là, se dit le petit prince, tandis qu’il poursuivait plus loin son voyage, celui-là serait méprisé - repetition

la guerre des moutons et des fleurs - AND?


c’est le seul qui ne me paraisse pas ridicule - le seul?


Celui-là, se dit en lui-même le petit prince, il raisonne un peu comme mon ivrogne. - "un peu" modify the relation? "Celui-la" and "il"? il.@emphasis.@distal?

Alors ce sera merveilleux quand tu m’auras apprivoisé! Alors je tâtonne comme ci et comme ça, tant bien que mal.


n’osait pas s’avouer - @dare?

il regrettait cette planète bénie à cause, surtout, des mille quatre cent quarante couchers de soleil par vingt-quatre heures! SURTOUT - @especially?

Ce n’est pas tout à fait ici! - tout à fait - @exactly?


Ce n’était qu’un renard semblable à cent mille autres - Ce n’était qu’un, It was nothing but... @simply ?

un renard semblable à cent mille autres - semblable - @like?? or UW? cent mille autres? cent mille.@other?


Ce qui m’émeut si fort de ce petit prince endormi, - about this little prince? gol + @about?

Ce sera gentil, tu sais. TU SAIS?

ce sera ce soir vers sept heures quarante (minutes.@ellipsis?)! relation between "ce soir" "sept heures"? between "heure" and "quarante (minutes)"? vers? @by? @around?


Celui-là est déjà très malade. @already?

je n’avais avec moi ni mécanicien, ni passagers - AVEC MOI: avais - ptn - mécanicien?


Et de nouveau, sans comprendre pourquoi, j’éprouvai un chagrin bizarre. - POURQUOI? 00@wh or a UW (reason)?


Et je fus stupéfait d’entendre le petit bonhomme me répondre: entendre ... me repondre? repondre@relative? @past?


car, sinon, pour m’humilier moi aussi, elle se laisserait vraiment mourir (pds). SINON? @otherwise


un arrosoir d’eau fraîche? mod?


Il me voyait, mon marteau à la main, et les doigts noirs de cambouis, penché sur un objet qui lui semblait très laid. penché? a verb? what tense?


Il n’a jamais rien fait - double negation: fait.@not + 00.@not.@thing? or fait.@not + 00.@any.@thing?


J’ai ainsi vécu seul, sans personne avec qui parler véritablement, a realtive object? parler.@relative - obj - personne? or parler - obj - personne.@relative?

une panne il y a six ans - panne - tim - ans.@ago?


Je ne suis pas si enrhumée que ça (pds) . my cold is not that bad (English translation of Petit Prince) or "I am not that sick.." - there is no such concept as "enrhumé" in Wordnet.

"des centaines d’autres"  centaines??

L'homme de la locomotive l'ignore lui-même. (?reflexive?)

La leçon que je donnais en valait la peine.

d'année en année

La preuve que le petit prince a existé c'est qu'il était ravissant, qu'il riait, et qu'il voulait un mouton.

La première fois ç’a été, il y a vingt-deux ans, par un hanneton qui était tombé Dieu sait d’où. La seconde fois ç’à été, il y a onze ans, par une crise de rhumatisme.


- une montagne haute comme celle-ci

- Elles se rassurent comme elles peuvent.

- Je fis remarquer au petit prince que les baobabs ne sont pas des arbustes, mais des arbres grands comme des églises et que, si même il emportait avec lui tout un troupeau d’éléphants, ce troupeau ne viendrait pas à bout d’un seul baobab.

- ces étoiles-là

- Mais, comme il disait, On ne sait jamais!


Petit bonhomme, n’est-ce pas que c’est un mauvais rêve cette histoire de serpent et de rendez-vous et d’étoile (pds). How to link the vocative to the rest of the phrase?


Quand il éteint son réverbère ça endort la fleur ou l’étoile. "eteint" and "endort" have a double relation - tim and agt? temporary solution: NULL UW for "quand" which is linked tim FROM "endort" and "tim" TO "eteint".

Quand je réussis à le rejoindre REUSSIR? Modal verb? @success?


tu deviens responsable - BECOME? modal verb?

I made him laugh - laugh@causative? who is agt? I or him?

Mais mon dessin, bien sûr, est beaucoup moins ravissant que le modèle.

Mais non!

il faut arracher la plante aussitôt, dès qu’on a su la reconnaître.dès que - tim ou con?

Mais si tu viens n’importe quand

Quand un astronome découvre l’une d’elles, il lui donne pour nom un numéro - quand (once) - tim or adv?

Quant aux grosses bêtes, je ne crains rien. quand aux (concernant)- about grosses bêtes?

Quel âge a-t-il? âge - ans? quel - qua ou mod?

Quelle drôle d’idée! @surprised?

voilà un explorateur! VOILA? Voici mon secret. VOICI?

je crois qu’elle m’a apprivoisé - apprivoiser@opinion. where is "je"?